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Was läuft eigentlich 
in einer CPU ab? 

Kann man die internen 
Abläufe sichtbar 
machen? Trotz 
Programmiersprachen 
der fünften 
Generation, 
objektorientierten 
Denkweisen, 
ausgefeilten Compiler- 
optimierungen: Die 
CPU hat sich kaum 
geändert. Der Artikel 
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Bau einer 4-Bit-CPU 
von der Planung bis 
zur Hardware- 
umsetzung. 
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V ^enn man versucht, sich 
die internen Vorgänge einer 
CPU zu verdeutlichen, was liegt 
da näher, als selbst eine aufzu- 
bauen? Seit der Einführung von 
programmierbaren Logikbau- 
steinen lassen sich (nahezu) be- 
liebige - wenn auch nicht belie- 
big viele - Logikfunktionen in 
einem Baustein realisieren. 
Also ist mit der Verwendung ei- 
niger PLDs das Ressourcenpro- 
blem zum Aufbau einer CPU 
gelöst. 

Es gibt im wesentlichen zwei 
Gründe, sich mit dem Innenle- 
ben einer CPU zu befassen. 
Zum einen der edukative: Die 
Datenflüsse einer selbst aufge- 
bauten CPU sind nun mal an- 
schaulicher als jedes abstrakte 
Diagramm einer Von-Neu- 
mann-CPU. Der hier vorgestell- 
te, diskret aufgebaute Mikro- 
prozessor, die dCPU-4, ermög- 
licht letztlich sogar die Pro- 
grammierung mit eigenen Ideen 
wie beispielsweise einem eige- 
nen Befehlssatz. 


Der zweite Grund entspringt der 
Praxis: Nicht jede CPU ist käuf- 
lich zu erwerben, die Vielfalt ist 
beschränkt. Zumindest gedank- 
lich lassen sich Mikroprozesso- 
ren konzipieren, die beispiels- 
weise 50 Interrupt-Quellen be- 
arbeiten oder über spezielle pro- 
blemoptimierte Befehls- und 
Rechensätze verfügen. Aber 
warum nicht die Theorie auch 
in die Tat umzusetzen? So wird 
der dCPU-4 eine integrierte 
Version folgen (iCPU-4). Alle 
Funktionen des diskreten Auf- 
baus sind dann in einem 
programmierten Logikbaustein 
(CPLD oder FPGA) integriert. 
Damit werden natürlich auch 
die fest verdrahteten Verbin- 
dungen zwischen den einzelnen 
Bausteinen leicht variierbar. 
Speziallösungen sind (fast) nur 
noch eine Frage der Ideen. 

Planungsphase 

Zu Beginn der konstruktiven 
Arbeiten steht die Planung: Was 


nimmt man als Ausgangspunkt, 
den späteren Befehlssatz, die 
Adressierungsmodi, die inter- 
nen Register, oder gibt es allge- 
meine Vorgaben, die übergrei- 
fend sein können? 

Aus den Erfahrungen der ersten 
Rechner, die im Rahmen des 
sogenannten Manhattan-Pro- 
jekts entwickelt wurden, formu- 
lierten J. von Neumann, H. H. 
Goldstine und A. W. Burks 1946 
anläßlich einer Bestandsaufnah- 
me ein allgemeines Rechnermo- 
dell. Es hat bis heute - trotz 
aller Kritik - als Von-Neu- 
mann-Modell seine grundlegen- 
de Gültigkeit behalten (Bild 1). 
Danach besteht ein Rechner aus 
den vier Bestandteilen Control 
Unit (CU), Arithmetic Logical 
Unit (ALU) - beide zusammen 
bilden die Central Processing 
Unit (CPU) - dem Speicher und 
der Ein-/Ausgabeeinheit. Zu- 
sammen mit dem verbindenden 
Bussystem ergibt sich dabei ein 
optimales (im Sinne von ‘mini- 
males’) System mit der Randbe- 
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Bild 1 . Das Von-Neumann-Rechnermodell. 


dingung, daß Code und Daten 
in dem einen Speicher abgelegt 
sind [1], Der Befehlscode wird 
zusätzlich als streng sequentiell 
betrachtet. Mit anderen Worten: 
sieht man von Sprungbefehlen, 
die die Monotonie unterbre- 
chen, einmal ab, stehen die 
einzelnen kodierten Befehls- 
worte an monoton aufsteigen- 
den Adressen. 

Die Zentraleinheit, die CPU, 
der dieses Projekt gewidmet ist, 
beinhaltet die Steuereinheit 
(CU), die als Befehlsprozessor- 
teil die komplette Hantierung 
aller Vorgänge um das Holen 
der Befehlsworte und deren In- 
terpretation beherrschen muß, 
und den Datenprozessorteil 
(ALU), dessen Aufgabe die Be- 
rechnung einer im Befehl ge- 
wünschten Verknüpfung ist. 
Seit Intel 1971 mit dem 4004 
den ersten 4-Bit-Mikroprozes- 
sor im Markt eingeführt hat, be- 
inhalten die Mikroprozessoren 
diesen zweiteiligen Aufbau 
gemäß der Von-Neumann-Ar- 
chitektur. Er findet sich auch in 
diesem Projekt konsequent um- 
gesetzt. 

Architektur 

Im allgemeinen kann man bei 
den sogenannten CISC-Archi- 
tekturen (Complex Instruction 
Set Computer) fünf Phasen in 
der Befehlsverarbeitung unter- 
scheiden, wobei selbstverständ- 
lich nicht jeder Befehl innerhalb 
seiner Interpretation jede Phase 
durchlaufen muß. Häufig wer- 
den die Programmbefehle, zur 
Unterscheidung im folgenden 
als Makrobefehle (dem in As- 
sembler unerfahrenen Program- 
mierer werden sie zweifellos als 
‘Mikro’ erscheinen), durch ei- 
gene Mikroprogramme mit Pro- 
grammspeicher innerhalb der 
CPU bearbeitet. Diese Mikro- 
programme unterscheiden sich 
weitestgehend von Makropro- 
grammen, auch von in Assem- 
blern geschriebenen, so daß es 
vernünftig ist, sie im Normalfall 
unbeeinflußbar vom Program- 
mierer zu halten. 

Die CPU-Architektur dieses 
Projekts läuft unter der Be- 
zeichnung dCPU-4: Sie ist dis- 
kret aufgebaut und hat eine Ver- 
arbeitungsbreite von 4 Bit. 
Auch wenn intern kein Mikro- 
programm zur Interpretation 
eines Makrobefehls abgearbei- 
tet wird, ist die Ähnlichkeit mit 
der CISC-Struktur unüberseh- 
bar. Trotzdem bleibt die Umset- 
zung von Makrobefehlen in in- 
terne Abläufe gewährleistet. 


Denn gerade letztere sollen ja 
transparent gestaltet werden. Zu 
diesem Zweck muß man sich 
die Phasen der Befehlsbearbei- 
tung zu Gemüte führen: 

- Fetch, Holen eines Befehls (1) 

- Decode, Entschlüsseln des 
Befehls (2) 

- Load, Laden der notwendigen 
Operanden (3) 

- Execute, Ausführen der Ope- 
ration (4) und 

- Write Back, Speichern des Er- 
gebnisses (5) 

Der Befehlsprozessorteil ist für 
die Phasen Fetch und Decode 
verantwortlich, teilweise aber 
auch für Load und Write Back. 
Das Holen des Befehlscodes be- 
steht dabei prinzipiell aus einem 
Speicherzugriff, für die dCPU-4 
allerdings aus zweien, da jeder 
Befehl als 8-Bit-Code vorliegt 
und sich dieses Byte nur in zwei 
Zugriffen laden läßt. 

Der geladene Befehl wird so 
weit dekodiert, wie es der Be- 
fehlsprozessorteil zum korrek- 
ten Laden der Operanden benö- 
tigt. Den weiteren Verlauf be- 
stimmen an dieser Stelle die 
Adressierungsmodi, deren Stu- 
dium für jeden Assembler-Pro- 
grammierer zum Pflichtteil ge- 
hört. Dazu das folgende Bei- 
spiel: 

Die unmittelbare Adressierung 
innerhalb eines Befehls bedeu- 
tet, daß der zu ladende Operand 
dem Befehlscode unmittelbar 
folgt und lediglich in einem 
zweiten Ladevorgang in einen 
geeigneten internen Speicher 
der CPU zu bringen ist. Eine 
Assembler-Kodierung wie zum 
Beispiel 

LDAA # $5 

entspricht der vorgeschlage- 
nen Assembler-Syntax für die 


dCPU-4 und ist an die bekannten 
Sprachelemente bei der 6502/ 
6809-CPU angelehnt. Der Be- 
fehl bedeutet demnach, daß der 
Befehlsprozessor zunächst den 
Code für ‘LDAA#’ (dCPU-4: 
$1 A) in ein Befehlsregister lädt 
(2 Zugriffszyklen ä 4 Bit), ihn 
interpretiert, den Befehlscode- 
zähler - auch Programm-Coun- 
ter genannt - entsprechend er- 
höht und schließlich auf den 
Operanden ($5) zugreift und die- 
sen in den Akkumulator kopiert 
(1 Buszugriff ä 4 Bit). 

Der gleiche Befehl mit direkter 
Adressierung lautet 

LDAA $5 

Hier lädt der Befehlsprozessor 
der dCPU-4 den Code $3A für 
LDAA (wiederum 2 Zugriffe ä 
4 Bit), anschließend den Ope- 
randen $5. Besser in diesem 
Fall $05, denn es wird sich um 
eine 8-Bit-Adresse handeln 
(also erneut 2 Zugriffe ä 4 Bit). 
Der geladene Operand beinhal- 
tet jedoch nur den Zeiger, das 
heißt die Adresse des Speicher- 
elements, in dem sich das ei- 
gentliche Datennibble befindet. 
Damit wird er also in ein 
Adreßzugriffsregister kopiert, 
um für den anschließenden Da- 
tenzugriff bereitzustehen. Im 
dritten Teil des Ladevorgangs 
wird nun via Adreßbus nicht 
mehr der Inhalt des Programm- 
Counters ausgegeben - der 
Codezugriff ist beendet -, son- 
dern das Adreßzugriffsregister, 
in dem in diesem Beispiel $05 
steht. Damit wird ein Zugriff - 
hier lesend - auf diese Spei- 
cherstelle angekündigt. Der 
Speicherinhalt bei $05 liegt an- 
schließend am Datenbus an und 
wird in den Akkumulator ko- 
piert. Erst jetzt ist der Befehl 
komplett abgearbeitet. 

Dieses Beispiel zeigt, daß eine 
gewisse Teilinterpretation der 


Befehle bereits im Befehlspro- 
zessor notwendig ist, um ein 
korrektes Laden aller Ope- 
randen zu ermöglichen. Ferner 
wird deutlich, daß die Adres- 
sierungsmodi (Assembler-Pro- 
grammierer mögen da bitte an 
‘indirekt-indiziert’ denken) ei- 
nen großen Einfluß auf die Ge- 
staltung dieses Prozessorteils 
ausüben. Die interne Systembus- 
schnittstelle, also der Anschluß 
zwischen internem Adreß-, 
Daten- und Steuerbus einerseits 
und dem externen Speicher an- 
dererseits, ist für die konstrukti- 
ve Unterbringung der Adressie- 
rungsmodi wichtig und wird an 
späterer Stelle noch im Detail 
behandelt. 

Die richtige Adresse 

An dieser Stelle sei eine kurze 
Einführung zu den bei dieser 
CPU benutzten Adressierungs- 
modi eingefügt: Befehle wie 
ROLA (Rotate Left Accumula- 
tor through Carry-Flag) enthal- 
ten bereits alle Angaben zu den 
benutzten Speicheroperanden, 
hier den Akkumulator und das 
Carry-Flag. Aus diesem Grund 
braucht in diesem einfachen 
Fall kein Operand geladen zu 
werden, man nennt diesen 
Adressierungsmodus ‘implizit’. 

Befehle, die den unmittelbar auf 
den Befehlscode folgenden 
Speicherinhalt bereits als Ope- 
rand nehmen, benötigen ledig- 
lich einen weiteren (Code-) 
Speicherzugriff, um alle Ope- 
randen - hier natürlich nur 
einen - zu laden. Da der Ope- 
rand unmittelbar im Code steht, 
bekommt diese Adressierungs- 
art den Namen ‘unmittelbar’, 
englisch ‘immediate’. Ein Bei- 
spiel dafür in der Syntax der 
dCPU-4 ist ‘LDAA# $5’, wie 
bereits oben dargestellt. 

Enthält der Codespeicher nur 
die Adresse des zu ladenden 
oder zu speichernden Operan- 
den, wird die Adressierungsart 
als ‘direkt’ bezeichnet. Der In- 
halt der direkt benannten 
(Daten-)Speicherstelle ist dann 
als Wert zu laden. Folglich 
sind im Ablauf des Befehls, 
zum Beispiel LDAA $05, wie 
oben angegeben, zwei Spei- 
cherzugriffe notwendig, zu- 
nächst im Code-, dann im Da- 
tenbereich. 

Für Sprungbefehle wie JMP (un- 
bedingt) oder JNZ (bedingt, 
springe bzw. verzweige, wenn 
Zero-Flag nicht gesetzt) wird 
häufig eine leicht abweichende 
Namensgebung benutzt, wie 
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Projekt 



ACC 

Akkumulator 


ZF 


CF 


Statusregister (SF 


PC 


Programmzähler 


Bild 3. Das Programmiermodell. 


Bild 2. Prinzipieller Aufbau 
der Arithmetic-Logical-Unit 
(ALU). 


auch in diesem Projekt. Wird der 
Operand (das Sprungziel) unmit- 
telbar im Code angegeben (Jump 
to Location), spricht man von di- 
rekter Adressierung, obwohl dies 
im internen Ablauf mehr Ähn- 
lichkeit mit der unmittelbaren 
Form der Datenbefehle hat. Ent- 
sprechend wird ein Sprung zu 
einer Zieladresse, die in einer an- 
gegebenen Adresse gespeichert 
wird, als ‘indirekt’ bezeichnet. 

Die Ausführung, insbesondere 
bei arithmetischer oder logi- 
scher Verknüpfung, obliegt der 
ALU. Sind der Befehl zur wei- 
teren Dekodierung sowie alle 
Operanden geladen, wird eine 
Verknüpfungseinheit dahinge- 
hend angesteuert, daß an ein 
oder zwei (gelegentlich auch 
mehreren) Eingangsbussen Si- 
gnale anliegen, die gemäß den 
Vorgaben durch Steuerleitun- 
gen miteinander zu verknüpfen 
sind. Das Ergebnis steht dann 
am Ausgangsbus der ALU nach 
einer kurzen Zeit zur weiteren 
Speicherung zur Verfügung. 

Die Form der Verknüpfung er- 
gibt das typische Bild der ALU 


(Bild 2). Die Komplexität in der 
logischen Verknüpfung eines 
oder zweier Eingänge liegt un- 
mittelbar in dem Befehlssatz 
begründet: Logisches ODER, 
Addition oder Bitinvertierung 
sind Funktionen mit einem oder 
zwei Parametern, die via Be- 
fehlssatz in der Programmie- 
rung eingesetzt werden und 
damit als Funktion in der ALU 
vorhanden sein müssen. 

Nach diesen generellen Bemer- 
kungen kann die eingangs ge- 
stellte Frage nach dem Aus- 
gangspunkt der CPU-Planung 
beantwortet werden: Neben der 
allgemeinen Vorgabe, eine 
Von-Neumann- Architektur zu 
implementieren, da jede andere 
Architektur, siehe beispielswei- 
se [2], zweifelsfrei den Rahmen 
der dCPU-4 sofort sprengen 


würde, gibt es noch drei weitere 
zu berücksichtigen: 

- der Befehlssatz respektive der 
darin enthaltenen logischen 
und arithmetischen Verknüp- 
fungen, die den Aufbau der 
ALU bestimmen, 

- die Adressierungsmodi, die 
verantwortlich für wesentliche 
Abläufe im Befehlsprozessor 
sind sowie 

- das Registermodell, das den 
Aufwand an internen Regi- 
stern, Flags und Verbindungs- 
wegen bestimmt. 

Normalerweise kann die Hard- 
ware zusätzlich Funktionen 
wie Interrupt-Request-Eingänge 
oder (Impuls-)Zähler bereitstel- 
len. Das hier vorgestellte Pro- 
zessormodell muß von diesen 
sonst üblichen Funktionalitäten 
ebenso absehen wie von der Im- 
plementierung eines Stacks, da 
dies erheblich mehr Aufwand an 
Hardware innerhalb der Steuer- 
werks bedeutete. Als Trost sei 
auf die Fortführung des Pro- 
jekts, die in komplexe PLDs in- 
tegrierte iCPU-4, verwiesen. 

In einem Punkt weicht die 
4-Bit-CPU von der strengen 
Von-Neumann- Architektur ab: 
Code- und Datenspeicherbe- 
reich werden getrennt adres- 
siert. Bereits bei der Darstel- 
lung der Adressierungsmodi ist 
auf den ursprünglichen Spei- 
cherbereich des Operanden 
hingewiesen worden. Mit einer 
gewissen Berechtigung läßt 
sich nunmehr festlegen, daß 
auch die Operanden der indi- 
rekten Sprünge im Datenspei- 
cher stehen können. Daten- 
und Codezugriffe sind damit 
klar unterscheidbar. Mittels 
Jumper wird die dCPU-4 so 
konfiguriert, daß sie mit einem 
neunten Bit auf ‘high’ auf den 
Datenbereich, mit demselben 
Adreßbit auf ‘low’ auf den Co- 
debereich zugreift. Dieser 
Kunstgriff bringt die strikte 
Trennung von Code- und Da- 
tenbereich und zugleich eine 


Verdopplung des gesamten 
Speicherbereichs, der mit 256 
Adressen nicht gerade üppig 
bemessenen ist. 

Das Modell 

Bild 3 zeigt das Programmier- 
modell der dCPU-4. Es zeichnet 
sich durch drei Register aus: 
Den Akkumulator (ACC) als 
zentrale Speicher- und Aus- 
gangsgröße, das Statusregister 
(SR) mit dem Zero-Flag (ZF) 
und dem Carry-Flag (CF) sowie 
den Programmzähler (PC). 
Letzter kann 8 Bit breite Werte 
aufnehmen, also exakt mit dem 
8-Bit-Adreßbus (ohne die 
künstliche Erweiterung) korre- 
spondieren. 

Der Befehlssatz für die dCPU-4 
ist ebenso willkürlich gewählt 
wie das Programmiermodell. 
Oberstes Prinzip für beide Kon- 
figurationen sind Minimalität, 
um den Hardwareaufwand, ins- 
besondere die Anzahl der 
GALs, überschaubar zu halten. 
Andererseits ist ein möglichst 
maximaler Befehlssatz notwen- 
dig, der das Schreiben von As- 
sembler-Programmen überhaupt 
erst gestattet. 

Tabelle 1 zeigt den komplet- 
ten Befehlssatz einschließlich 
der zugehörigen zugelassenen 
Adressierungsarten. Dem ver- 
sierten Assembler-Programmie- 
rer fällt sofort auf, daß keinerlei 
Unterprogrammsprünge vorge- 
sehen sind. Der Grund hierfür 
liegt in der (gewählten) Be- 
schränktheit der Hardware. Un- 
terprogrammsprünge, insbeson- 
dere die Speicherung der Rück- 
sprungadressen, sind mit der 
Implementierung eines Stacks 
verbunden'. Der jedoch fehlt 
in dieser CPU-Konstruktion. 
Trotzdem können via indirekter 
(unbedingter oder bedingter) 
Sprünge Unterprogrammkon- 
struktionen im Assembler ge- 
schrieben werden. Dazu jedoch 
erst später. 

Mit dem Programmiermodell 
und dem Befehlssatz liegen 


Verschiebebefehle 

LDAA 

Load Accumulator A (direkt, unmittelbar) 

-STÄA 

Store Accumulator A (direkt) 

Arithmetische Befehle 

DECA 

Decrement Accumulator A (implizit) 

INCA 

Increment Accumulator A (implizit) 

ADDA 

Add with Carry to Accumulator A (direkt, unmittelbar) 

CM PA 

Compare with Accumulator A (direkt, unmittelbar) 

Logische Befehle 

ROLA 

Rotate Lel’t Accumulator A through Carry (implizit) 

EORA 

Exclusive OR with Accumulator A (direkt, unmittelbar) 

ORA 

Logical OR with Accumulator A (direkt, unmittelbar) 

ANDA 

Logical AND with Accumulator A (direkt, unmittelbar) 

Programmflußkontrollbefehle 

SEC 

Set Carry-Flag (implizit) 

CLC 

Clear Carry-Flag (implizit) 

JMP 

Jump to Location (direkt, indirekt) 

WC ■ 

Jump if Carry not set (direkt, indirekt) 

JC 

Jump if Carry set (direkt, indirekt) 

, JNZ 

Jump if Zero-Flag not set (direkt, indirekt) 

• ;|Z 

Jump if Zero-Flag set (direkt, indirekt) 

Sonstige Befehle 

NOP 

No Operation (implizit) 


Tabelle 1. Der Befehlsumfang der dCPU-4. 
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Mnemonlc 

Adressierung 

Variierte 

Flags 

Phase 1 
(Fetch) 

Phase 2 
(Decode) 

Phase 3 
(Lead) 

Phase 4 
(Execute) 

Phase 5 
(Wrlte Back) 

OpCode 

(hex) 

LDAA 

unmittelbar 

- 

sk 

sk 

*(i) 

— 


0001 1010(1 Ah) 

LDAA 

direkt 

- 

* 

sk 

*(2) 

- 

- 

0011 1010 (3Ah) 

STAA 

direkt 

— 

* 

Jk 

*(2) 

sk 

sk 

0011 1011 (3Bh) 

DECA 

implizit 

Z 

* 

sk 


sk 

_ 

0 0 00 0000 (00h) 

1NCA 

implizit 

z 

* 

»k 

- 

sk.... 

- 

0 0 000001 (01h) 

ADDA 

unmittelbar 

z,c 

* 

♦ 

MD 

sk 

_ 

0 0 01 0010 (12h) 

ADDA 

direkt 

Z.C 

* 

sk 

* (2) 


— 

0011 0010 (32h) 

CM PA 

unmittelbar 

z,c 

>k 

* 

Mi) 

. sk 

— 

0 0 01 0011 (13h) 

CMPA 

direkt 

z,c 

* 

sk 

M2) 

sk 

- 

0011 0011 (33h) 

ROLA 

implizit 

c 

# 

* 


sk 


0 0 00 0100 (04h) 

EORA 

unmittelbar 

z 

* 

sk 

Ml) 

* 


0001 0101 (15h) 

EORA 

direkt 

z 



M2) 

sk 

— 

0011 0101 (35h) 

ORA 

unmittelbar 

z 

* 

• sk 

MD 

sk 


0001 01 10 (16h) 

ORA 

direkt 

z 

* 

* 

M2) 

>k 

— 

0011 01 10 (36h) 

ANDA 

unmittelbar 

z 

sk 

sk 

MD 

sk 

* 

0001 0111 (17h) 

ANDA 

direkt 

z 

* 

sk 

M2) 

sk 

- 

00 11 0111 (37h) 

SEC 

implizit 

c 

* 

»k 


sk 

_ 

0 0 00 1000 (08h) 

CLC 

implizit 

c 

* 


— 

sk 

- 

0 0 001001 (09h) 

JMP 

direkt 

- 

* 

Sk 

MD 

sk 


1 001 1100 (9Ch) 

JMP 

indirekt 

- 

* 

• ■ . 

M2) 

sk 

- 

1 011 1100 (BCh) 

JNC 

direkt 

- 


* 

MD 

sk 

- 

1001 1101 (9Dh) 

JNC 

indirekt 

- 

* 

.. . -;.-i k ■ 

M2) 

sk 

— 

1 011 1101 (BDh) 

JO 

direkt 

- 

■ ;■ 

* 

MD 

sk 

- 

1 1 01 1101 (DDh) 

JC 

indirekt 

- 


* 

M2) 

sk 

— 

1 1 11 1101 (FDh) 

JNZ 

direkt 

- 


sk 

MD 

sk 

- 

1 001 1110(9Eh) 

JNZ 

indirekt 

- 

sk 

sk 

M2) 

sk 

- 

1 011 1110 (BEh) 

JZ 

direkt 

- 

5k 

sk 

MD 

sk 

- 

1 101 IIIO(DEh) 

JZ 

indirekt 

— 

* 

sk 

M2) 

■ sk' 

— 

1 1 11 1110 (FEh) 

NOP 

implizit 

- 

sk 

* 

- 

- 

_ 

0 0 001111 (OFh) 


Tabelle 2. Befehle und Adressierungen der dCPU-4. 

Die Zahlen in der Spalte 3 der Phase 3 geben die Anzahl 
der Ladezyklen an. 


alle gewünschten Softwareres- 
sourcen fest. Damit kann die 
konstruktive Phase beginnen, 
die bewußt auf übergreifende 
Methoden wie VHDL und um- 
fangreiche Simulationen ver- 
zichtet und statt dessen mit 
einer unmittelbaren konstrukti- 
ven Synthese und den zugehöri- 
gen Formulierungen der Pro- 
grammierung der GALs in As- 
sembler beginnt. 

Konstruktion 

Programmiermodell und Be- 
fehlssatz selbst sind dagegen - 
dies sei nochmals ausdrücklich 
erwähnt - zwar aus der Erfah- 
rung heraus, aber dennoch will- 
kürlich gewählt. Die Anzahl der 


logischen und arithmetischen 
Verknüpfungen beispielsweise 
ist mit der Programmierkapa- 
zität des GAL22V10, das die 
ALU bildet, limitiert. Selbstver- 
ständlich lassen sich auch kom- 
plett andere Befehlssätze imple- 
mentieren. Zum Beispiel aus di- 
daktischen Gründen, aber auch 
bedingt durch die Art der späte- 
ren Softwareapplikation, kann 
es notwendig sein, den Befehls- 
satz anzupassen. 

Bevor die Hardwarerealisierung 
der Logik, die Gesamtschaltung 
und anschließend der interne 
Befehlsablauf näher im Detail 
beschrieben werden, erscheint 
eine Analyse der angegebenen 
Befehle und Adressierungsarten 
notwendig. Diese Analyse um- 


7 6 5 4 3 2 1 0 


BG 

CC 

Adr Mode 

Codenummer 






Bild 4. Der Aufbau des Operationscodes. 


ELRAD 1994, Heft 10 


43 


ivalni 


faßt die Mnemonics, die Pha- 
sen, die sie intern durchlaufen 
(von den 5 angegebenen Phasen 
können selbstverständlich eini- 
ge entfallen), die variierten 
Flags sowie einen Vorschlag für 
die Kodierung in hexadezimaler 
(besser: sedezimaler) Form. Ta- 
belle 2 zeigt dies im Überblick. 

Die bezeichneten Phasen ent- 
sprechen (auch in ihrer Nume- 
rierung) den bereits oben auf- 
geführten. Die in der Tabelle 
angegebene Zahl zur Phase 3 
bezieht sich auf die Anzahl 
der Ladevorgänge, die für das 
Laden des Operanden notwen- 
dig sind. Zusätzlich gilt bei der 
dCPU-4, daß der zweite La- 
devorgang grundsätzlich im 
Datenspeicherbereich abläuft. 
Der binär und sedezimal an- 
gegebene Befehlscode wurde so 
fl gewählt, daß innerhalb von vier 
Bitgruppen die Kodierung sowie 
bereits Dekodierungsinformatio- 
nen enthalten sind. Der Aufbau 
in dieser Form hat derart ent- 
scheidende Vorteile bei der 
Konstruktion der dCPU-4, daß 
in keiner Weise darauf verzich- 
tet werden sollte. Die direkt als 
Bits kodierten Dekodierungsin- 
formationen bedeuten zugleich 
eine erhebliche Aufwandsver- 
ringerung im internen Aufbau 
des Befehlsprozessors. 

Statik 

Die Zusammensetzung des Op- 
Codes (Bild 4) wird durch die 
Bitgruppen BG für Be- 
fehlsgruppe, CC für Condition 
Code bei bedingten Sprüngen, 
Adr_Mode für den Adressie- 
rungsmodus und die Befehls- 
nummer erreicht. 

Die Befehle werden in die 
Gruppe der Sprungbefehle und 
die der andere Befehle einge- 
teilt. Ein Blick in Tabelle 2 
zeigt, daß BG = 1 die Sprung- 
befehle kennzeichnet. 

Bei bedingten Sprüngen wird 
mit CC = 1 der Sprung ausge- 
führt, wenn das betreffende 
Flag (CF oder ZF) gesetzt ist, 
für CC = 0 entsprechend, wenn 
das Flag gelöscht ist. Unbeding- 
te Sprungbefehle sowie alle an- 
deren Befehle setzen CC = 0. 

Das Wesen der Sprungbefehle 
besteht darin, den Befehlszähler 
mit der Zieladresse neu zu laden 
und den nächsten Code an die- 
ser Stelle abzulegen. Um be- 
dingte Sprünge auszulösen, 
muß der Befehlsprozessor zuvor 
CC und das entsprechende Flag 
auf Gleichheit überprüfen. 


Die bereits diskutierten Adres- 
sierungsarten implizit, unmit- 
telbar (bzw. direkt) sowie di- 
rekt (bzw. indirekt für Sprung- 
befehle) sind in den Bits 5 und 
4 kodiert, und zwar in den Bit- 
kombinationen 00b, 01b und 
11b. An dieser Stelle zeigt sich 
auch, daß der Modus ‘direkt’ 
bei Sprungbefehlen so kodiert 
wird wie ‘unmittelbar’ bei den 
übrigen und ‘indirekt’ entspre- 
chend wie ‘direkt’. Der eigent- 
liche Befehl ist dann lediglich 
durchnumeriert - und zwar 
über alle Befehle durchgehend 
- nicht den beiden Befehls- 
gruppen zugeordnet. Hier 
ließen sich noch eine Reihe 
weiterer Kodierungen aufneh- 
men, der Phantasie des einzel- 
nen Mikroprozessorentwicklers 
sind die Grenzen lediglich in 
der Aufnahmekapazität der 
GALs für die Dekodierung 
gesetzt. Durchnumerierung, 
Adressierungsart, Condition 
Code und Befehlsgruppe erge- 
ben zusammengesetzt den Op- 
code, zum Beispiel 

001 1 1 01 Ob (3ah) für LDM oder 
10111110b (beh) fürJNZ 

Abschließend muß noch festge- 
legt werden, in welcher Reihen- 
folge die einzelnen Daten- und 
Codebytes im Speicher liegen 
sollen: Mit Intel als Vorbild 
wurde hier low Nibble vor high 
Nibble gewählt. Diese Reihen- 
folge ist natürlich variierbar, 
falls dieses Modell nicht den 
Vorstellungen entspricht. Weni- 
ger selbstverständlich ist jedoch 
die Tatsache, daß alle Codezu- 
griffe in ganzzahligen Vielfa- 
chen von Bytes (und nicht Nib- 
ble) durchzuführen sind. Ein 
Code darf also nur bei geraden 
Nibble-Adressen beginnen. Im 
Unterschied dazu müssen Da- 
tenzugriffe natürlich auf jede 
Adresse möglich sein. 

Im nächsten Teil dieser Arti- 
kelserie geht es um die hard- 
waremäßige Umsetzung der hier 
formulierten Voraussetzungen 
der dCPU-4. Die gesamte Logik, 
bestehend aus Interfaces, Steuer- 
werken, Akkumulator sowie der 
‘Arithmetisch-Logischen Ein- 
heit’, ist in nicht weniger als 
zehn GALs untergebracht und 
wird anhand von Listings aus- 
führlich beschrieben. pen 
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4-BMkroprozessor selbst entwickeln, Teil 2: Die Schaltung der dCPU-4 


Dietmar P. F, Möller, 
Christian Siemers 


Zu Zeiten, da es noch 
keine programmierba- 
ren Logikbausteine 
gab, wäre man nur 
belächelt worden, 
wenn man die Idee 
von einem selbst- 
entwickelten Mikro- 
prozessor geäußert 
hätte. Will man sich 
jedoch die internen 


Abläufe einer CPU 
verdeutlichen, so ist 
eine ‘gläsern’ aufge- 
baute Hardware 
allemal anschaulicher 
als trockene 
Diagramme. 


■ Wicht nur aus edukativer 
Sicht, macht es Sinn, sich eine 
CPU selbst auf zu bauen. Es sind 
durchaus Problemstellungen 
denkbar, die es sinnvoll erschei- 
nen lassen, eine CPU seihst zu 
entwickeln, anstatt auf ein käuf- 
liches Exemplar ‘von der Stan- 
ge’ zurückzugreifen. Dank der 
Verfügbarkeit hochkomplexer 
PLDs beziehungsweise FPGAs 
stellt die Hardware heute kein 
Problem mehr dar. Der erste 
Teil des Artikels zeigte am Bei- 
spiel einer diskret aufgebauten 
4-Bit-CPU die Grundlagen und 
Planungen, die zur Entwicklung 
einer eigenen CPU erforderlich 
sind, auf. In diesem Teil geht es 
nun um die schaltungsiechni- 
sche Umsetzung des auf gezeig- 
ten CPU-Konzepts. 

Befehiscode, Ad res sierungs ar- 
ten und die zum kompletten 
Ablauf notwendigen fünf Pha- 
sen einer Befehlsausführung 
müssen in konsequenter Weise 
in dem konkreteiwVufban der 


CPU berücksichtigt werden. 
Dies geschieht in internen 
Daten- und Adreläpfaden sowie 
in zusätzlich zum Programmier- 
modell integrierten Registern, 
die dem Assemblerprogrammie- 
rer natürlich weiterhin verbor- 
gen bleiben. Bild 5 zeigt dazu 
das Blockschaltbild der kom- 
pletten CPU. Dieses Dia- 
gramm findet eine unmittelbare 
Entsprechung im Sehaltpian 
(Bild 6), indem den Registern 
dort bestimmte ICs zugeordnet 
sind (Tabelle 3). 

Innerhalb der Schaltung und 
damit der CPU werden mehrere 
interne Bus Systeme benötigt, 
um die Aufgaben zur Abarbei- 
tung der Makrobefehle erfüllen 
zu können (Tabelle 4). Neben 
diesen Bussystemen wird die 
Kommunikation und Koordina- 
tion zwischen den einzelnen 
Elementen des Befehlsprozes- 
sors der CPU durch Steuersi- 
gnale des Steuerwerks herge- 
slcllt, deren zusammenhängen- 


de Darstellung mit Bezug zu 
den Phasen der Befehls abarbei- 
tung für das Verständnis der- in- 
ternen Abläufe sehr wichtig ist. 

Innerhalb des Steuerwerks 1 
(Control Unit #1) werden min- 
destens 12 Phasen, teilweise 
sogar alle 16 Phasen benötigt, 
um alle Abläufe durchlaufen zu 
können. Nicht benötigte Phasen 
wie das Laden von Operanden 
bei Befehlen mit impliziter 
Adressierung bleiben in der 
dCPU-4 ungenutzt, da bei der 
Planung ein möglichst einfacher 
Aufbau ohne Befehl szyklusop- 
timierung im Vordergrund 
stand. Bild 7 zeigt den zeitli- 
chen Verlauf für einen Ladebe- 
fehl mit direkter Adressierung, 
wobei alle mit (*) bezeichnet.en 
Phasen für andere Befehle oder 
Adressierungsarten gegebenen- 
falls einen abweichenden Ver- 
lauf nehmen. Ferner zeigt sich 
in diesem Timing- Diagramm, 
daß die Phasen sich teilweise 
überlappen, was den internen 
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Bild 5. ihren Systembus, alle Signale 

Das sind taktbezogen, ein Veriän- 

Block- gern eines Zugriffs ist nicht 

schalt- möglich. Dieses Busprotokoll 

biid der wird im dritten Teil des Arti- 

dCPU-4. kels naher besprochen. Der 

Verzicht auf modernere Varian- 
ten wie asynchron oder semi- 
synchron fl] liegt auch an die- 
ser Stelle in dem minimalen 
Aufwand an Hardwareressour- 
cen begründet. 

Die am Adreßbus ausgegebene 
Adresse wiederum kann durch 
den Programm-Counter (IC9, 
GAL22V10) gebildet werden - 
dies entspricht der Fetch- oder 
dem ersten Teil der Load -Phase 
- oder durch das Adreßpuffer- 
register (IC 10, GAL22V10), in 

Ablauf erleichtert und beschlcu- Sprungbefehle müssen die 8- heißt dabei, daß der Adreßbus dem die effektive Zu griff s- 

nigt. Eine gegenseitige Beein- Bit- Adresse ihres Operanden die gültige Adresse an den adresse gespeichert wird, wie 

flussung ist natürlich dadurch wiederum in dem Zwi- äußeren Pins anzcigt, der Da- etwa bei direkten Zugriffen im 

ausgeschlossen, daß alle Befeh- schenspeicher IC11 zusammen- tenbus auf Eingang (high impe- Datenbereich. Entsprechend 

ie bestimmte Phasen auslassen setzen. Für diese Adressie- dance) oder mit einem gültigen diesen Vorgaben muß das Re- 

oder minimieren. Die übrigen rungsarten wird jeweils ein In- Ausgangswert beschältet wird gister für den Program m-Coun- 

Diagramme können entspre- kremen tsignal zum Programm- und zeitlich korreliert die (ex- ter ein Inkrement beinhalten, 

chend der Programmierung der Counter hin generiert, so daß ternen) Steuerbussignale wie Programm -Counter und Adreß- 

GALs, insbesondere des Steuer- die Adresse für den nächsten /RD und / WR aktiv sind. Die pufferregister müssen extern 

Werks 1, erstellt werden. auszuführenden Befehl korrekt dCPU-4 verwendet dabei ein ladbar sein, eine CPU-interne 


IC 8 erzeugt die Steuersignale 
durch die Zählerbits aus IC7 
(4 Bits, an negativer Flanke um- 
schallend) und den jeweils vor- 
liegenden Befehlscodeinforma- 
tionen, indem an der positiven 
Flanke die Signale am Ausgang 
des ICs übernommen werden. 
Durch diese Art der Synchroni- 
sierung ergibt sich ein störungs- 
freier Betrieb, während ohne 
diesen Schritt durchaus Spikes 
auftreten können, wie sich 
während der Testphase gezeigt 
hat. 


bleibt. Das Durchlaufen des synchrones Busprotokoll für Ansteuerung schaltet die Aus- 
zweiten Teils der Load-Phase - 
hier gibt das Adreßregister nach 

vorheriger Übernahme (Steuer- IC-Nummer GAL- Dp Verwendungszweck 

Signal /CLKJLA) die Adreßin- IC2 fe'VlO ALU, Berechnung von Verknüpfungen 

formation aus - wird für Nicht- 1C5 20RA10 Akkumulator und Statustlags 

Sprungbefehle mit diiektei IC:6 26CV 1 2 Steuereinheit, Teil 2; speziell Steuerung 

Adressierung in den Phasen 12 für Daumprozessor 

und 13 durchgefuhrt, das Lade- IC8 26CVI2 Steuereinheit, Teil 1 ; speziell Steuerung 

ergebnis (4 Bit) wird direkt in des Befehlsprozessoiteils 

den Akkumulator (IC5) oder IC9 22V1Ü Programmzähler 

einen Zwischenspeicher (1C1) IC 10 22V 10 Adreßpufferregister, Speicherung der 

geladen. Bei indirekten Sprung- effektiven Adresse 

befehlen verläuft dies als zwei- (CI ! 18V JO Befehlspufferregister, .speziell für Zwi- 

teiliger Zugriff (die Sprung- schenspeichcrung und für Operanden 

adresse ist 8 Bit breit) in den 


Die Fcteh-Phasc läuft in Fonn 
zweier Zugriffe auf den Code- 
speicher ab. Der Programm- 
Counter (PC) gibt dazu die 
entsprechende Adresse aus 
(Steuersignal /OE_PC). Die 
geladenen Daten werden im Be- 
fehl sz wischen Speicher 1 (GAL 
18V10, IC11) zusammengesetzt 
(Steuersignale /IN_11, /IN_12 
und /CLK_ZS1) und im Be- 
fehls zwi sehen spei eher 2 gespei- 
chert (Steuersignal /LE_ZS2), 
Ferner fällt das scheinbare Feh- 
len der Deeode-Phase auf. Die 
Dekodierung ist komplett in der 
Hardware der GALs implemen- 
tiert. und benötigt, daher keine 
T aktzyklen zum Ablauf. 

Der erste Teil der Load-Phase 
ladt den auf den Befehl folgen- 
den Operanden. Das geschieht 
allerdings nur, wenn eine direk- 
te beziehungsweise indirekte 
Adressierung voriiegt. Direkte 
Nicht-Sprung- und Sprungbe- 


Phascn 8. . , 1 1 unter Beteiligung 
von 1C1 1 . 

Die übrigen zwei Takte eines 
Befehlszyklus werden von dem 
Datenprozessorteil benötigt. Zu 
diesem Zweck schaltet das 
Steuerwerk 2 diverse Treiber- 
ICs aktiv und versorgt die ALU 
mit Steuersignalen bezüglich 
der gewünschten logischen oder 
arithmetischen Verknüpfung, 
wobei beim Ladebefehl ledig- 
lich ein Übern ah me signai (FQ) 
zum Akkumulator (IC5) akti- 
viert wird. Zunächst werden je- 
doch die Elemente der dCPU-4 
im einzelnen vorgestellt. 

Das Interface zum 
Adreß- und Datenbus 

Während der Phasen Fetch, 
Load sowie Write Back greift 
der Mikroprozessor lesend oder 
schreibend auf den externen 


Tabelle 3: Die in der dCPU-4 benutzten GALs und ihr 
Verwendungszweck. 


Büssvsteme Verwendungszweck 

. 

A| 0 . . .3 J Datenbus im Dutenprozessorteil (ALU, Akku, 

Zwis eheuspeicher) 

B[0. . .3] Datenbus zwischen Datenprozessorteil und 

B efeh 1 s prozes so rte i I sowie externer Datenbus 

0[0..;1] Steuerbus für A|0,,,3J und B[0...3J; CI entspricht 

dem /WR-Signal (extern) 

Df0...2| Steuerbus für ALU-Operationen 

E[0. . .3] Datenbus zwischen Akkumulator, ALU und 

Trcibcr-lC zu Bus Af0.. .31 

F[0...1] Steuerbus zum Akkumulator (Speichern etc.) 

G[0. .3] Datenbus für die unteren 4 Bits des aktuellen 

Befehls 

H[0. .2] Taktübertragung an Dalenprozessorteil 

1 1 0. . . 7 ] Datenbus für Operanden 

j[0,..3j Datenbus für die oberen 4 Bits des aktuellen 

Befehls 

K[0. . .7] Adreßbus für die aktuelle Lese /Schrctbadresse 

M 1 0 ... 3 1 Datenbus zur ALU (2. Eingangsbus) 


fehle sowie die indirekten Speicherbereich zu. Zugriff Tabelle 4. Die internen Bussysteme der dCPU-4. 
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Bild 6. Schalt- 




Bild 7. 
Der 

zeitliche 

Verlauf 

der 

Steuer- 

signale 

im 

Steuer- 
werk 1, 


gange (maximal) eines dieser 
Register akliv. 

Listing 1 beschreibt im GAL- 
ASM-Fomial (GDS. [3]) die 
Programmierung des Programm- 
Zählers für die Adreßbits kO... 
k2 sowie die Takt- und Reset- 
Generierung (AR entspricht 
dem asynchronen Reset). Die 
übrigen Adreßbits sind entspre- 
chend ausgeführt (die komplet- 
ten Listings befinden sich ab- 
rufbereit in der ELRAD-Mail- 
box). 

Die Wahl fiel auf ein GAL 
22V 10, da sieb hier alle Funk- 
tionen wie Aufwärtszählen, 
Laden eines Adreß werts und 
Reset auf die Adresse 0 imple- 
mentieren lassen. Andererseits 
ist aber auch eine eigene Takt- 
generierung zur Übernahme von 
Zählerzuständen in die Aus- 
gang sregister durch eine kombi- 
natorische Logik möglich. Letz- 
teres muß bei fertigen Zähler- 
bausteinen entfallen. 

Tm Listing 1 fällt allerdings 
auch auf, daß der Ladevorgang 
einer neuen Adresse (von den 

Eingängen 10 i7), wie er bei 

Sprungbefehlen auf tritt, eine 
Verschiebung um ein Bit mit 
sich führt, was einer Multiplika- 
tion mit dem Faktor zwei 
gleichkommt. Hier macht sich 
die Benutzung eines tabellenge- 
steuerten 8- Bit- Assemblers, wie 
er int nächsten Abschnitt erklärt 
ist, bemerkbar; Der 8-Bit-As- 
sembler berechnet die Sprung- 
ziele in 8-Bit- Adressen, die 4- 
Bit-CPU benötigt aber die An- 
gabe von 4-Bit-Adressen, und 
diese differieren gerade um den 
Faktor zwei. Sollte ein anderer 
Assembler, vielleicht speziell 
für die dCPU-4, zum Einsatz 
kommen, dann müßte diese 
Links Verschiebung wieder rück- 
gängig gemacht werden. 


Der (wie erwähnt, in zwei Zu- 
griffen a 4 Bit ablaufende) 
Fetch des Mikroprozessors lie- 
fert einen 8-Bit-Code, der zur 
weiteren Dekodierung im Be- 
fehlspuffer zwischengespei- 
chert wird. Letzterer ist durch 
ICH und 1012 realisiert. Für 
ICH kommt ein GAL 18V 10 
zum Einsatz. Hierdurch ist in 
flexibler Weise die Zusammen- 
setzung des Befehlscodcs, an- 
kommend in zwei Teileödes, 
integrierbar, sowie als endgülti- 
gen Speicher einen 74HCT573. 
Listing 2 zeigt einen Ausschnitt 
aus der Programmierung für 
ICH. 

Die Übernahme des Befehlsco- 
des (während der Fetch-Phase) 


und eventuell des/der Operanden 
(während der Load-Phase(n)) 
vollzieht sich jeweils in zwei 
Abschnitten, die durch die 
Steuereinheit 1 geleitet werden. 
Die unteren 4 Bits des jeweili- 
gen Codes werden entsprechend 
10, die oberen entsprechend T4 
in die Ausgangsregister gela- 
den, wobei die Programmierung 
des GALs dafür Sorge trägt, 
daß die jeweils andere Hälfte 
erhalten bleibt. Nach dem kom- 
pletten Laden des Befehlscodes 
wnd dieser in IC12 (74HCT573) 
übertragen. Eine Ladeadresse 
wird in das LOAD_ADDRESS- 
Register (IC10, GAL22V10), 
eventuelle Sprung ad ressen von 
IC11 direkt in den Program m- 
zähler kopiert. 


Die Adreß- und Daten bnstreiber 
aus Bild 5 sind nicht explizit als 
ICs ausgeführt, sondern in den 
jeweiligen GALs, deren Ein- 
beziehungs weise Ausgänge an 
dem jeweiligen Bus angeschlos- 
sen sind, integriert. 

Das Steuerwerk 1 

Die erste Phase der Code-Inter- 
pretation obliegt nun dem Steu- 
erwerk 1 (ICS, GAL26CV12). 
Es entscheidet, ob und in wel- 
cher Form die Operanden zu 
laden sind und letztlich auch, 
wohin sie geladen werden müs- 
sen. Diese Decode- Phase setzt 
insbesondere die Bitfelder im 
Opeode für den Adressierungs- 
modus (Bit 4 und 5, siehe Bild 4, 
Teil 1) und die Befehlsgruppe 
(Sprung- oder Nichtsprungbe- 
fehl, Bit 7) in weitere interne 
Operationen um. 

Befehle mit impliziter Adressie- 
rung benötigen keinen weiteren 
Operanden, die Aktivitäten am 
Bus werden beendet, die interne 
Bearbeitung beginnt. Bei unmit- 
telbarer Adressierung von Nicht- 
Sprungbefehlen übernimmt, auf 
den Opeode folgend, entweder 
direkt IC 1 als Zwischenspeicher 
oder der Akkumulator (TC5) 
den Inhalt der Adresse. Dies ist 
in jedem Fall eine Ladeoperati- 
on mit 4 Bit, begleitet von zwei 
PC_UP- Signalen, um den Pro- 
gramm zähl er auf die nächste 
Adresse zu stellen. 

Direkte Nicht- Sprungbefehle 
sowie alle Sprungbefehle laden 
die Adresse als Operand in 
IC1 1, welches sie aus zwei La- 
dezugriffen ä 4 Bit zusammen- 
setzt.. Indirekte Sprungbefehle 
laden anschließend noch den In- 
halt der Adresse wieder als 8- 
Bit-Wort in ICH. Diese Lade- 
vorgängc steuert IC8 in Verbin- 
dung mit dem Takt, wozu die 
CPU insgesamt 16 Taktzyklen 
durchläuft. Listing 3 zeigt den 
relevanten Ausschnitt aus den 
GAL-Gleichungen. 

Die Programmierung des Steu- 
erwerks enthält neben der Ge- 
nerierung von Steuerleitungen 
zu Pu fferregi stem die Synthese 
eines Buszyklus durch insge- 
samt 16 Taktphasen. Dabei 
führt sie während jeweils zwei- 
er Phasen eine bestimmte Akti- 
on durch (Bild 7). Beispielswei- 
se werden in den TaktenO. -.3 
die beiden Halbbytes des Be- 
fehlscodes in IC1I geladen, 
zwischen dritter' und vierter 
Phase in IC 1 2 gespeichert, in 
den Phasen 4... 7 der Operand 
geladen, falls im Opeode Bit 4 


CHIP PC 

GAL22V1Ü 


CLK 14 
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k2.TRST 

m 

+ k2 

* kl * kO * /PC..L0AD + k2 * 

* /kO =f /PC_L0AD * il * PC_ 
OE 

/kl.* /PC_L0 äD 
LOAD 

CIiK_DÜT 


PC_ÜP 


AS = 

RESET 



Listing 1. Der Programmzähler (IC9. 22V10). 


CHIP 3EF_ZS1 GJtieVlO 


CLK„ZSl 

bO 


bl 

b2 

bl i IN_ 

.11 

/ItJ_12 NC NC GND 

NC i3 

12 


il 

iö 

i7 i6 

iS 

i4 VCC 

iO : = 

bö 

* 

IN_11 + 

10 * IN_12 


üebernahme bei lN_ll r 


T iO 

* 

/IH_11 * 

/IN_12 


Halten bei IN_12 aktiv 
sowie inaktiv (bei Spikes) 

i4 j = 

bO 

* 

+ 

i4 * IH_11 


üebernahae bei IN_12, 


* i4 

* 

/ I N_ 1 1 * 

/IN_12 

; 

Halten bei IN_11 aktiv 


; sowie inaktiv (Spikes) 


Listing 2. Das Befehlsregister (ICH, 18V10). 
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und 5 gesetzt sowie Bit 7 
gelöscht sind, oder falls Bit? 
gesetzt ist (Sprungbefehl), in 
den Phasen 8. . . 1 1 der Inhalt der 
Adresse geladen, auf die der 
Operand verweist, falls im Op- 


code Bit 7 gesetzt ist. Mit Aus- 
nahme des STAA-Befehls, der 
schreibend wirkt, greifen alle 
Nicht-Sprungbefehle mit unmit- 
telbarer oder direkter Adressie- 
rung in der Phase 12 nochmals 


auf den Speieher zu: der end- 
gültige Operand wird geladen. 
Das Signal CLK_ZS1 wird im 
übrigen zum Speicher hin als 
/RD-Signal herausgeführt. 

Die Phasen 12... 15 werden zur 
weiteren Durchführung der ei- 
gentl i eben Operation an das 
Steuerwerk 2 übermittelt, mit 
Ausnahme der Sprungbefehle, 
bei denen - bei durchzuführen- 
dem Sprung, also unter Erfül- 
lung der eventuellen Bedingung 

- lediglich der Programm- 
Counter 1C9 neu zu laden ist. 
Diese Betrachtung der Aufga- 
ben von IC 8 macht deutlich, 
daß die Wahl der Kodierung 
mit fest zugeordneten Bits für 
Aktionsfelder sehr sinnvoll ist, 
um die Dekodierungsarbeit ent- 
sprechend zu erleichtern. Eine 
genaue Betrachtung der Phasen 
am Bus erfolgt im dritten Teil 
des Artikels. 

Der Daten- 
prozessorteil 

IC2, 1C5 und IC6 bilden als 
ALU, Akkumulator/Slatusflags 
und Steuerwerk 2 das Herzstück 
des Datenprozessors. Die übri- 
gen ICs dienen der Zwischen- 
speieherung und der Abschir- 
mung der diversen internen Da- 
tenbusse gegeneinander. IC 6, 
das Steuerwerk 2, muß natur- 
gemäß im Zusammenhang mit 
ICS gesehen werden und erhält 

- wie bereits erwähnt - seine 
Phaseninformationen aus die- 
sem Teil des Steuerwerks. 

Das Steuerwerk 2 

Der zweite Teil des Steuer- 
werks (IC6, GAL26CV12) er- 
hält die notwendigen Phasen- 
inforrrtationen an den Pins 1, 2 
und 28 (H[0...2J). Diese Infor- 
mationen geben Aufschluß dar- 
über, ob sich die CPU in den 
Takten 12... 15 eines Buszyklus 
befindet, in denen der Daten- 
prozessorteil arbeiten soll. 

Vom Opcodc werden nunmehr 
nur noch die unteren 4 Bits 
(GL0...3]) benötigt, da die 
Adressierungsinformation be- 
reits für die Operanden ausge- 


weitet wurde, während das 
Condition-Codc-Bit und die Be- 
fehls gruppe (Bit 6 und 7 des 
Opcodes) nur eine Rolle bei 
Sprungbefehlen spielen, die je- 
doch im Steuerwerk 1 bearbei- 
tet werden. Wie in Listing 3 
dargestellt, werden die Phasen- 
infonnationen an das Steuer- 
werk 2, auch nur für Befehle 
aus der Nicht-Sprungbefehl - 
gruppe überlragen. 

Das Steuerwerk 2 generiert aus 
den Phasen- und Code-Informa- 
tionen eine Reihe von Steuer- 
signalen für die ALU (IC2). 
Dabei handelt es sich zum einen 
um solche, die der ALU die Art 
der Verknüpfung milteilen, und 
zum anderen um welche, die in- 
nerhalb des Datenprozessors für 
den Datenfluß von Akkumula- 
tor und Zwischenpuffer zustän- 
dig sind. Listing 4 zeigt die 
komplette Verschaltung des 
GALs. 

Die arithmetisch- 
logische Einheit 
(ALU) 

Die ALU (IC2, GAL22V10) 
muß die Steuerinfurmationen in 
Verknüpfungen mit einem oder 
zwei Operanden Umsetzern Zu 
diesem Zweck sind vier Ein- 
gangsleitungen direkt mit dem 
Akkumulator (IC5) verbunden, 
vier weitere via einem der inter- 
nen Datenbusse zum Operan- 
denregisler. Die vier Ausgangs- 
leitungen, an denen die ALU 
das Ergebnis der Berechnung 
ausgibt, sind mit dem Akkumu- 
lator (eingangsseitig) verbun- 
den. Dadurch wird nochmals 
die zentrale Funktion dieses Re- 
gisters unterstrichen: das Ergeb- 
nis einer Berechnung liegt 
immer abgespeichert im Akku- 
mulator. Weitere Ausgangslei- 
tungen dienen der Übermittlung 
der Flags nach außen. 

Die Konzeption der ALU ist ent- 
scheidend für die Lähigkeit der 
CPU, arithmetische und logische 
Funktionen berechnen zu kön- 
nen. In Anlehnung an die be- 
kannte (aber fest verdrahtete) 
ALU 74xxl81 stehen die Be- 
zeichnungen dO für M (zur Un- 


CHIP CU_Pättl GAUfCV12 

CLK_IN g2 g3 jO jl j2 VCC j3 CLKO CLKl 
CLK2 CLR3 COND.FLAG gl 

/0E„PC /PCJJP /CLK_LA /CLR_ES1 /LE_ZS2 /I JLll GND /IH_12 hO hl 
h2 /0E_LA /PC_L0AD gO 


0E_PC = /CLK3 ; waehrend ersten 3 Phasen immer aktiv 
+ CLK3 * CLK2 * / i 3 4 /jl * jO 

; sowie bei unmittelbaren Nicht-Sprungbefehlen 
; in den Phasen 12 - 15 

IN_11 = /CLKl * /CLK3 ; 0.* 1. Phase; Laden des Befehls 

; (Adresse: PC), sowie 4-+ 5. Phase, laden des Operanden 
; fuer Befehl 

+ /CLKl * /CLK2 * CLK3 * j3 * jl 

? 8 .+ 9. Phase: Laden bei direkter Adressierung eines 
t Sprungbefehls 

IN_12 = CLKl 4 /CLK3 ; 2 + + 3, Phase; Laden 2. Teil 

; sowie 6 . *7, Phase, laden 2. Teil des Operanden au 3 Befehl 
+ CLKl * /CLK2 4 CLK3 * j 3 » 

f 10.4 11. Phase bei direkter Adressierung, Sprungbefehl 

CLK.ZSl = / C L-K 0 * /CLK2 * /CLK3 

Uebernahmasignal 1. Zwischenspeicher fuer alle Befehle 
+ /CLKO * CLK2 * /CLK3 * /j3 * jl * jO 

i 4>/5. sowie 6 . / 7 - Phase nur fuer direkte 
; Nicht-Sprungbefehle 

+ /CLKO 4 CLK2 « /CLK3 * j 3 ; sowie Sprungbefehle 

+ /CLKO * /CLK2 4 CLK3 * jl * j3 

; Phasen 8/9 und 10/11 bei indirekter Adressierung von 
j Sprungbefehlen 

+ /CLKO * /CLKl 4 CLF.2 * CLK3 4 /j 3 * jO * /gO 

t /CLKO * /CLKl * CLR2 * CLK3 4 /j3 * jO * /g3 

; sowie Phase 12/13 fuer unmittelbare und direkte 
,♦ Adressierung bei Nicht-Sprungbefehlen, Ausnahme! STAA 


PC_GP = CLKO 4 /CLK2 4 /CLK3 

i 1. auf 2 ► + .3 , auf 4. Phase? PC++ 

* CLKO * CLK2 4 /CLK3 * /j3 * jl * 

; Phase 5/6 und 7/8, falls direkte Adressierung bei 
; Nicht-Sprungbefehlen vorliegt 
4 CLKO 4 CLK2 4 /CLK3 * j3 ; Phase: PC = PC+1 
; dito, falls Sprungbefehl vorliegt 
+ /CLKO 4 CLK2 4 0LK3 * jO * /jl * /j3 

? Phase 12/13 und 14/15, fallö unmittelbare Adressierung 
i bei Nicht-Sprungbefehlen 
+ /CLKO * CLKl ® CLK2 * CLK3 * j3 4 PC_LQAD 

; Phase 14/15 bei Sprungbefehlen (neuen PC-Staud 
; uebernehmen, falls der Sprung auagefuehrt wird} 

/ LE_ZS2 = CLKO 4 CLKl * /CLK2 4 /CLK3 

; 3. auf 4. Phase: Sichern Befehlswort (Latch) 

CLK_LA = CLKO * CLKl 4 CLK2 4 / CLE3 4 jl * jO 
j 7. auf 8. Phase; Sichern Adresswort 
+ CLKO 4 /CLKl < /CLK2 * CLK3 4 j3 4 jl. 4 jO 
; 9, auf 10. Phase: Inkrement Adresse bei Jump 

0E_LÄ = /CLK2 4 CLK3 4 j3 * jl 

} aktiv in 8. bis 11. Phase fuer indirekte Sprungbefehle 
+ CLK2 4 CLK3 4 /j3 4 jl * jö 

; sowie 12,-15, Phase fuer direkte Nicht-Sprungbefehle 

PC_LQAD = CLK2 * CLK3 * j3 * / j2 4 j o * g3 * g2 
4 /gl 4 /gO ; JMP . , . 



i 

CLK2 

4 CLK3 4 j3 

4 

n * 

jO *■ * g2 


4 gl = 

C0ND_ 

FLAG 


JZ .. 







+ 

CLK2 

4 CLK3 * j3 

t 

in 

* jO * g3 * gi 


4 gl 

/COND 

_FLAG 


■INS . . 







+ 

CLK2 

* CLKl 4 j 3 

4 

32 * 

jo ’ g3 * g2 




8 

/gl 4 

g 8 4 C0ND_i 

FLAG 






; 

JC 







+ 

CLK2 

4 CLK3 * j3 

4 

m 

1 i» ' «3 t sl 




8 

/gl 4 

gft 4 / COND 

_FLAG 






i 

JNC ,, 






hO 

= CLK2 * CLK3 4 /j3 



f High fuer Takte 

12-15 

hl 

= /CLKO 4 

CLK2 4 CLK3 

* 

/ri 

,♦ Takt 12 und 

14 


h2 

= / CLKl 4 

CLK2 4 CLK3 

* 

w 

,♦ Takt 12 und 

13 



Listing 3. Das Steuerwerk 1 (iCS, 26CV12). 


dl 

d2 

logische Funküon 

arithmetische Funktion 



(dO = 1) 

(dO = ü) 

0 

0 

e XORm 

e PLUS 1 (TNC c) 

1 

0 

e ORA m 

e PLUS Y PLUS CO 

0 

1 

e AND m 

c MINUS 1 (DEC e) 

al 

1 

ROLe 

e COMPARE m 


Tabelle 5. Die Funktionstabelle der ALU. 


CHIP 

CU. 

_PART2 GAL26CV12 

h2 

hl 

ffO ffl g2 g3 VCC NC NC 

NC 

NC 

NC NC NC 

NC 

/fO 

/GATE_l_OE /ALÜ_OE /GATE_2_CLK 

fl 

GND 

/ c0 /c 1 NC d2 dl dO hO 


; Die Bezeichnungen der Gates stimaen mit der Zeichnung ueherein 
; Die Eingaenge gx (x = 0..7) entsprechen dem Befehlscode in 
; Binaerdarstellung 

fO = bO 4 /h2 4 hl * /g3 * /g2 * /gl 
i fuer INCA- {ülh} und DEC&- 
; Befehl {00h) 

* hO 4 /h2 *■ hl ff g3 4 gl s /gO 

S fuer ADCA-Befehl {x2h} und 
; fuer ORA-Befehl (xOh} 
f hO 4 /h2 * hl * /g3 * g2 4 /gl 4 /gO 
; fuer ROLA-Befehl {04h} 

+ hO * /h2 4 hl 4 /g3 * g2 4 gQ 

; fuer EORA-Befehl (x5h) 

? fuer ANDA-Befehl (x7h) 

+ hO .4 h2 * hl * g3 * /g2 4 gl t /gO 

; fuer LDAA-Befehl (xah) 

j fO wird fuer den LDAA-Befehl in Phase 12 generiert, 

! fuer alle anderen in Phase 14 


fl = ho 4 /H2 4 hl 4 / gj * / g2 4 /gl 
; fuer INCA- {01h} und DECA- 
; Befehl {OOh} 

+ hO 4 hl 4 / h2 4 /g3 * /g2 4 gl 

; fuer ADDA (x2h) und CMPA- 
; Befehl (x3h) 

+ hO 4 hl =* /h2 * /g3 4 g2 f /gl * /gO 
f fuer ROLA-Befehl (04h) 

+ hO * /h2 4 hl 4 / g3 4 g2 4 gl 4 / gO 
; fuer ORA-Befehl {x6h) 

+ hO 4 /h2 4 hl 4 /g3 4 g3 * g(J 
; fuer EORA-Befehl {x5h) 

! fuer ANDA-Befehl jx7h) 

; fl beBtimat durch 1 die Uebernahme der Flags aus der ALU 


GATE_l_OE = hO 4 g3 4 /g2 * gl * gO 
; fuer STAA-Befehl {3bh> 

* hü 4 h2 4 /hl * /g3 4 / g2 4 gl 4 gO 
; und fuer CMPA-Befehl (x3h) 

hO 4 /h2 4 /g 3 s /g2 * /gi 
; fuer DECA-Befehl (OOh) und 
? INCA-Befehl (01h) 
hO 4 /h2 4 / g 3 4 / g2 * gl 4 /gQ 
; fuer ADDA-Befehl (x2h) 

ho 4 /h2 4 /gl * g 2 ; fuer ROLA-Befehl (04h} 

? EORA-/ ORA-Befehl (x5h/x6h) 

; und ANDA-Befehl {x7h) 

GATE_2_CLK. = hO * h2 * hl 4 /g3 * gl 

; fuer ADDA-Befehl {x2h) r 
: CNPA-Befehl {x3h) , 

; ORA-Befehl (xfih} und 
? ANDA-Befehl {x7h} 
t hü 4 h2 t hl 4 /gi f g 2 * /gl * gO 
; fuer EORA-Befehl (x5ß] 

CÜ = ho * h2 4 / g3 4 gl 

; fuer ADDA-Befehl (x2h), 

, CMPA-Befehl (x3h), 

; ORA-Befehl {x6h) und 
; ANDA-Befehl (x7h) 

+ hO * h.2 * /g3 4 g 2 4 /gl 4 gfl 
; fuer EORA-Befehl {x5b) 

+ hO 4 h2 * g3 * /g2 * gl * / gO 
t fuer LDAA-Befehl (xah) 


ALU_OE = 


Ci = hO 4 h2 4 g3 4 / g2 4 gl * g fl 

* hü 4 / h2 4 hl 4 g3 4 / g2 4 gl 4 gQ 
t fuer STAA-Befehl (3bh) 

; in den Phasen 12 bis 14 


; Es folgen die Steuerleitungen fuer die ALU 

; dü wird auf 1 fuer die logischen Funktionen der ALU gesetzt 

d0 hO * / g3 4 g2 

,• ROLA-Befehl {04h}, 

; EORA-Befehl {x5h) , 

; ORA-Befehl <x6h) und 
; ANDA-Befehl <x7h} 

dl = hö 4 /g3 * /g2 * gl 

i ADDA-Befehl (x2hj und 
f CMPA-Befehl (x3h) 
i hO ♦ /g3 * g2 4 / gp 

? ROLA-Befehl (04h) und 
; ORA-Befehl {x6h) 

d2 = hO * / g3 4 /gl 4 / gO 

; DECA-Befehl (00h) und 
; ROLA-Befehl {04h} 

+ hO * /g3 * gl * gO 

; CNPA-Befehl {x3h} und 
t ANDA-Befehl (x7h) 


CH ^ 


AÄ14_BIT_3 

GAL22V10 





dO 

dl 

d2 

mö 

ml m2 ] 

m3 

eü 



el 

e2 

@3 

GND 






CRY_ 

Fl 

CI 

C2 

C3 50 a! 

1 a2 

a3 


CRY_ 

F0 

ZER0_ 

F0 

/ ALU_OE 


VCC 



aO 

s 

eO 4 

snO 4 

CRY_F1 4 / dO 

1 4 dl 4 

/ d 2 




4 eO * 

/n 0 

4 /CRY_F1 4 

/dü 

4 dl 


/ d2 



4 /e 0 

4 mO 

4 /CRY_F1 4 

/dü 

4 dl 

* 

/d2 



4 /eO 

4 /mO 

4 CRY_F1 4 

/dü 

4 Ql 

t 

/d2 




; e 

PLUS m PLUS 

CRY_ 

.Fl 





4 /e 0 

* /da 

4 /dl 








i e 

PLUS/K1NUS : 

L 






4 e 0 4 

/dO 

4 dl 4 42 4 

/dO 






4 /eü 

4 HÜ 

4 dl * 42 4 

/ dO 







; e 

und m vergleichen 





4 /el} 

4 mö 

4= dO s /dl 4 

/42 






4 eO 4 

/m0 

4 dü * /dl 4 

/d2 







r e 

XOR m 







4 eO 4 

dO 4 

dl 4 /ö2 f 

mü 4 

dl 

4 / d2 * 




r e 

OR m 







4 eO * 

mO 4 

/dl 4 42 4 

dü 







; e 

ÄND m 







4 CRY_ 

Fl 4 

dl * d2 4 dÜ 






; ROL e 


dO 


aü .TRST 


= ALU_OE ; 



CI 

eO 

4 mö 4 dl 4 /d2 

4 /dO 



t eÜ 

4 CRY_Fl 4 dl * 

/di 4 

/dO 


+ mO 

4 CRY_F1 4 dl 4 

/42 4 

/dö 


; CI fuer e4m+CRY_Fl 
+ eO * /dl 4 /a2 4 / dO 
; CI fuer e * 1 
+ /e 0 * /dl 4 da 4 /dO 
; CI fuer e - 1 

CRY_F0 = e3 4 bl j * di 4 /d2 * /dO 

4 e3 4 03 4 di 4 / d 2 * /dO 

4 m3 4 C3 4 dl 4 /d2 * /dO 

t CRY^FO fuer e*m+l 
i CRY_F1 * /dl 

? CRY_F0 fuer e*l, e-1, e AND m und e OR m 
f CRY_F1 * /dl 4 /d2 4 ao 

F CRY_Fö fuer e XOR b 
+ e3 =» dl 4 ü2 4 dO 

; CRY_F0 fuer ROL 
4 e3 * /m3 4 dl * d2 ' /dO 
+ /a3 * *2 4 / m 2 t dl * d2 * f dO 
+ /a3 4 / a2 4 el 4 /ml * dl* d2 * /dO 
+ /a3 4 / ä 2 4 /al » eO 4 / mp 4 dl * d2 4 /dü 
; CRY_F0 fuer Vergleich 

/ZERO _F 0 = aO + al + a2 4 a3 


Listing 5. Die arithmetisch-logische Einheit {IC2, 22V10). 


terscheidung zwischen arithmeti- 
schen und logischen Funktionen) 
sowie dl/d2 für SO/Sl zur Aus- 
wahl der jeweiligen Funktion. 
Tabelle 5 zeigt alle in der ALU 
implementierten Funktionen. 

Die Wahl für den Zielbauslein 
fiel auf ein GAL 22V10, da die- 
ser die größten internen Res- 
sourcen (insgesamt 120 OR- 
Lines) zur Verfügung stellt, ein 
Kriterium, das gerade bei so 
vielfältigen Verknüpfungen äu- 
ßerst wichtig ist. Listing 5 zeigt 
einen Teil der Implementierung. 

Mit CRY_F 1 ist dabei der Ein- 
gangs wert des bisherigen Cairy- 
Bits, mit E10...3] und M[0...3J 
die Eingangsoperanden bezeich- 
net. Die Ausgänge CI... 
C3 sind lediglich als Hilfsaus- 
gänge konzipiert. Dies ist zum 
Beispiel für die Addition not- 


Listing 4. Das Steuerwerk 2 
(IC6, 26CV12). 


wendig, da die Hardwareres- 
sourcen, vor allem die starre 
Anordnung als UND-ODER- 
Matrix auch des GAL22V10 an- 
sonsten eine Implementierung 
solcher Funktionen unmöglich 
machen würde. Die Konsequen- 
zen sind in der Realisierung der 
Addition durch die Serienschal- 
tung von 1 -Bit- Volladdierern 
sichtbar, Moderne, vor allem 
schnellere Konzepte wie paralle- 
le Addierer oder Carry-Look- 
Ahead-Addierer [4] lassen sieh 
hier nicht betücksichtigen. 

Das Ergebnis liegt nach ma- 
ximal vierfacher IC -Lauf zeit 
an den Ausgängen A[0...3], 
CRY_FO für Carry-Flag und 
ZERO_FO für Zero-Flag vor 
und kann in den Akkumulator 
beziehungsweise das Statusregi- 
ster übernommen werden. Die 
Flags sind bei den unterschied- 
lichen Operationen nach den 
Angaben in Tabelle 6 definiert. 

Der Akkumulator (IC5, GAL 
20RA10) selbst ist als Register 
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Operation 

CRY_F0 

c PLUS m PLUS CRY_F1 

entsprechend Ergebnis 

e PLUS/MINUS 1 

= CRY F! 

e XOR in. ORA. AND 

- CRY_F1 

ROL 

= a3 

e COMP ARE m 

- 1 fuer e >= in. sonst 0 


Tabelle 6. Die Bedingungen für die Flags. Das Zero-Flag 
wird genau dann 1, wenn alle Ausgänge A[0...3) = 0 sind. 


mit Tri state- Au sg angstrei ber 
ohne weitere Sonderfunktionen 
konzipiert. Diese Funktion wäre 
ebenfalls zum Beispiel in einem 
74HCT574 gut integriert. Da 
die interne Verarbeitungsbreile 
jedoch nur 4 Bit beträgt, konnte 
das Statusregister gleich mit in 
demselben Baustein implemen- 
tiert werden. 

Akkumulator und 
Statusregister 

Die Befehle SBC und CLC, die 
die CPU ausfuhren soll, machen 
es jedoch notwendig, einen 
GAL20RA10 auszuwählen. 
Dieser GAL-Baustein bietet die 
Möglichkeit, Bedingungen zum 
asynchronen Reset und Prcset 
von Ausgangsreg i Stern zu for- 


mulieren, so daß die Makrobe- 
fehle SEC und CLC auf genau 
diese Funktionen zu rückgeführt 
werden. Listing 6 zeigt wesent- 
liche Ausschnitte der GAL- Pro- 
grammierung. Dabei sollte man 
beachten, daß der Befehl 
SEt Carry (Opcotte 00001 000 binär) 

in einen asynchronen Reset um- 
gesetzt wird und am Ausgang 
invertiert erscheint. Der Grund 
ist, daß das interne Register des 
GAL20RA10 rückgesetzt wird. 
Entsprechend erzeugt 
CLear Cany (Opcode 00001 001 binär) 

einen asynchronen Preset. 

Das Signal COND_FLAG wurde 
speziell für die Steuereinheit 1 
definiert. Es übermittelt den ak- 
tuellen Wert des für einen be- 
dingten Sprung relevanten 


CHIP AKSQMULATOR ÜA130RA1Ü 

/PL ZER0_FD CKI_F0 a3 ä2 al aü fd £1 
33 92 GHD 

/0E gl gü eO el e.2 e3 C0ND_FLAG 
CRY_Fi ZER0.F1 hO VCC 

eO ;= aO eO.CLCK = ffl 

el := al 

el.CLCK = fü 

CRY_F1 is CRY_F0 * fl + CRY_Fl * /fl 

; Uebernahme nur bei fl = 1 

CRY Fl ,CLCK = fO 

CRY_Fl , APRST = g3 * / g-2 * /gl * gü * hO 

CRY_Fl . ÄRST = gl * /g2 * /gl ? / gü * hü 

ZERO_Fl ts 2>ERO_F0 * fl + ZEE0_Fl * /fl 

£ERÜ_Fl. CIiCK = fü 

C0ND_FLAG = SER0_F1 * g3 * g2 * gl * /gO i Sero-Flag 

+ CRY_F1 * g3 * g2 * /gl * gD ; Carry-Flag 


Listing 6. Akkumulator/Statusregister {IC5, 2GRA10). 


Flags. Diese Ans wertehilfe ist 
im Prinzip nicht Aufgabe eines 
Statusregisters, doch sie wurde 
an dieser Stelle implementiert, 
um den Bedarf an Eingangsver- 
bindungen des Steuerwerks 1, 
niedrig zu halten. 

Im dritten Teil des CPU-Pro- 
jekts geht es dann um Busproto- 
kolle, den inneren Aufbau von 
Makrobefehlen, die Assembler- 
Programmierung und schließ- 
lich um Aufbau und Inbetrieb- 
nahme der Hardware. pen 


Literatur 

[1] H. Bähring, 'Mikrosysteme’, 
Sp ringer- Verlag , Heidelberg 
1991 

[2] A. Bode, ‘Alternative zur 

Von -Neumann- A rchitektur 

ct 11/89, S. 316 ff. 

[3] GDS Bedienungsanleitung, 
SH-Elektonik, Kiel 1994 

(4 J W. Schiffmann , R. Schmitz, 

‘Technische Informatik’, 
Band 1 und 2, Springer-Ver- 
lag, Heidelberg 1 992 



Rechner-Baustelle 

4-Bit-Mikroprozessor selbst entwickeln, Teil 3: 

Die internen Abläufe und die Spelcherplatlne 



Dietmar P.F. Möller 
Christian Siemers 

Wer heute auf die Idee 
kommt, die zentrale 
Einheit eines Rechners 
‘zu Fuß’ aufzubauen, 
kann damit nur zwei 
Ziele verfolgen. 
Entweder er will zu 
edukativen Zwecken 
die internen Abläufe 
einer CPU verdeut- 
lichen, was allemal 
anschaulicher ist als 
trockene Diagramme, 
oder aber er möchte 
mit einer selbst- 
designten Eigenent- 
wicklung an Problem- 
stellungen heran- 
treten, die sich mit 
käuflichen Exemplaren 
nur schwerlich lösen 
ließen. An beide Ziel- 
gruppen wendet sich 
dieser Artikel. 


m m ersten Teil des Rechner- 
projekts ging es um die Grund- 
lagen, die zur Planung und Ent- 
wicklung einer ‘eigenen’ CPU 
notwendig sind. Der zweite be- 
schrieb die schaltungstechni- 
sche Umsetzung des aufgezeig- 
ten Rechnerkonzepts. Nicht we- 
niger als sieben GALs sind not- 
wendig, um die komplette 
Logik der diskret aufgebauten 
4-Bit-CPU, der sogenannten 
dCPU-4, unterzubringen. Bild 8 
zeigt die Hardware-Umsetzung 
in Form einer recht luftig de- 
signten Platine. In diesem Teil 
geht es um die Betrachtung der 
internen Schaltung und der in- 
ternen Abläufe der CPU. Sie 
liefert entsprechend Aufschluß 
über den Anschluß externer 
Komponenten wie Speicher- 
und Peripheriebausteine. Dies 
ist zumeist als Businterface be- 
kannt, und die dCPU-4 besitzt 
wie jede CPU drei Teilbussyste- 
me, Adreß-, Daten- und Steuer- 
bus, die hier an einem 25poli- 
gen SubMin-D-Stecker heraus- 
geführt sind (Tabelle 7). 

Durch einen Schaltungstrick 
wird in der dCPU-4 der Adreß- 
bus als 8 + 1 -Bit-Bus ausge- 


führt; Codezugriffe werden mit 
A8 = 0, Datenzugriffe mit 
A8 = 1 durchgeführt, was einem 
Adressierungsraum von 512 
Adressen entspricht. Der mo- 
dellhafte Charakter der CPU 
wird an diesem Punkt besonders 
fühlbar, denn ein Raum von 256 
Halbbytes für die Kodierung, 
also 128 Programmspeicherplät- 
ze, stellt eine arge Einschrän- 
kung dar. Späteren Erweiterun- 
gen, zum Beispiel durch Inte- 
gration der dCPU-4 in CPLDs 
oder FPGAs, soll es Vorbehalten 
bleiben, auf einen 12-Bit- Adreß- 
bus, der in der Interface-Definti- 
on mit A9...A11 bereits ange- 
deutet ist, zu erweitern. 

Ein aktives /RD-Signal zeigt 
einen Lesezugriff, ein aktives 
AVR-Signal entsprechend einen 
Schreibzugriff an. Diese Signa- 


le müssen durch eine externe 
Dekodierungslogik ausgewertet 
werden, um Speicher- und Peri- 
pherie-ICs korrekt ansteuern zu 
können. Der zeitliche Ablauf ist 
dabei streng mit dem Prozessor- 
takt synchronisiert, also nicht 
mittels Wartezyklen verlänger- 
bar, da ein semi-synchrones 
oder asynchrones Busprotokoll 
die Hardware erheblich kom- 
plexer gestalten würde (Bild 9). 

Der interne Ablauf 
von Makrobefehlen, 
Teil 2 

Für das Verständnis der inneren 
Vorgänge einer CPU ist es be- 
sonders wichtig, sich mit den in- 
ternen Datenflüssen auseinan- 
derzusetzen, da sie die Teilaktio- 
nen wie Fetch oder Load kenn- 
zeichnen. Dieser Datenfluß kann 
beispielsweise mit einem Oszil- 
loskop nachgewiesen werden. 
Exemplarisch soll dies für den 
Assemblerbefehl ADDA 2ch, 
dessen Kodierung 32h 2ch er- 
gibt, behandelt werden. 

Bild 10 zeigt die beteiligten 
Einheiten an der Fetch-Phase 
dieses Befehls, die in den Tak- 
ten 0.. .3 abläuft. Nach Takt 0 
und 1 können an IC11 die 
Bitwerte 0010b an den 
Pins 15... 12 gemessen werden, 
da dieses Halbbyte aus dem Co- 
despeicher ausgelesen wurde 
und mittels der steigenden Flan- 
ke an /CLK_ZS 1 (IC8, Pin 18) 
bei /IN_1 1 low (IC8, Pin 20) 
übernommen wurde. 

Nach Phase 3 ist der komplette 
Befehlscode in IC11 mit Hilfe 
eines weiteren /CLK_ZS1 -Im- 
pulses und des Steuersignals 
/IN_12 low zusammengestellt 
und durch /LE_ZS2 in IC 12 
übertragen. Der gültige Befehls- 
code liegt nunmehr mit Beginn 
der Load-Phase an IC8 zur In- 
terpretation vor. Der Pro- 
grammzähler wurde nach jedem 
Zugriff um eins inkrementiert 
und zeigt jetzt auf die Speicher- 
stelle, an der der Operand steht. 

Die Load-Phase läuft in den 
Takten 4. ..7 sowie 12 und 13 
ab (Bild 11): Zunächst interpre- 
tiert die Steuereinheit 1 (IC8) 
die Adressierungsart als direkt 


Bussystem 

Bezeichnungen 

Stedoorbolegung 

Adreßbus 

A0...A8 

25. .17 

Datenbus 

A9...A11 

D0...D3 

1 6. . . 14 (ständig lew, für späteren Ausbau) 

13.. .10 

Steuerbus 

/RD 

2 


/WR 

1 


Tabelle 7: Bussysteme der dCPU-4. 
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Bild 9. 
Zeitlicher 
Verlauf der 
Signale am 
Prozessor- 
bus, hier 
am Beispiel 
des STAA- 
Befehls. 


und stellt durch zwei Halbbyte- 
Zugriffe die Ladeadresse, in 
dem Beispiel 2ch, zusammen. 
Diese erste Load-Phase verläuft 
exakt wie die Fetch-Phase, zwei 
sukzessive Zugriffe werden 


Stückliste 


74HCT574 
GAL 22V 10 
74HCT541 
74HCT244 
GAL 20RA10 
GAL 26CV12 
74HCT393 
18V10 


Sonstiges: 

RI . . .3 Widerstände 3k3 

12 x CBKondensatorenlOOn, ker. 
J 1 Jumper, 2pol. 

ST1 25pol. Sub-D-Buchse, 

gewinkelt 

ST2 9pol. Sub-D-Buchse, 

gewinkelt 

1 Platine 


durch /CLK_ZS 1 , /IN_11 und 
/IN12 intern gesteuert, der PC 
wird insgesamt um zwei erhöht. 
Das Ladeergebnis wird beim 
Übergang Takt 7 auf 8 aller- 
dings in IC 10 kopiert, da der 
Datenzugriff auf diese Adresse 
gehen soll. 

Im Verlauf der Takte 8 ... 11 
dieses Befehls verweilt die 
dCPU-4 im inaktiven Zustand, 
alle Bustreiber sind auf High-Z 
geschaltet. In den Takten 12 
und 13, der zweiten Load-Phase 
(Bild 12), wird der Inhalt des 
Adreß-Pufferregisters, IC10, am 
Adreßbus ausgegeben und 
/CLK_ZS 1 im Takt 12 auf Low 
gesetzt: Der Lesezugriff auf die 
Adresse 2ch beginnt, 
/CLK_ZS1 hat nach außen hin 
die Funktion des /RD-Signals. 
Dieser Lesezugriff ist nur 4 Bit 
breit, erfolgt also nur einfach, 
das Ergebnis wird in ein Zwi- 


Bild 10. Daten- 
und Steuer- 
signalfluß 
während der 
Fetch-Phase. 


Acnunu- 

lator 

IC 5 


schenregister (IC1) am Eingang 
der ALU kopiert. 

Die abschließenden Phasen 14 
und 15 genügen als Execute- 
Phase der ALU, um das Ergeb- 
nis zu berechnen und in den Ak- 
kumulator einschließlich der Sta- 
tusflags zu schreiben (Bild 13). 
Zu diesem Zweck sind alle Ein- 
gangsinformationen (bisheriger 
Inhalt des Akkumulators, gelese- 
nes Daten-Nibble, Flags) vor- 
handen, die Steuerinformationen 
werden durch die Steuereinheit 2 
(IC6) generiert, die ihre Taktin- 
formationen durch IC8 und die 
Informationen zum Befehlscode 
durch IC 12 erhält. Mit dem 
Übergang von Takt 14 auf 15 er- 
hält der Akkumulator samt Flags 
durch das Steuersignal fO (IC6, 
Pin 16) den notwendigen Über- 
nahmetakt; die Flags, die beim 
Additionsbefehl natürlich mit 
übernommen werden, werden al- 




Biid 8. Die Platine Bild 1 1 . Daten- und 

der dCPU-4. Steuersignalfluß während 

der ersten Load-Phase. 



lerdings nur für fl = 1 neu ge- 
setzt und behalten ansonsten 
ihren Wert. 

Die Speicherplatine 

Zum Betrieb der dCPU-4 sind 
noch zwei weitere Platinen not- 
wendig: eine Speicherplatine 
sowie eine Taktplatine. Die 
Speicherplatine enthält ein 
EPROM mit 32 kByte Pro- 
grammspeicherplatz, ein stati- 
sches RAM mit 8 kByte, ein 8- 
Bit-Eingabe- und 8-Bit-Ausga- 
beport sowie eine Dekodier- 
und Umschaltelogik (Bild 14). 
Die Speicher-ICs sind ange- 
sichts des begrenzten Adressie- 
rungsbereichs überdimensio- 
niert, was aber zumindestens für 
das EPROM durch eine Um- 
schaltelogik mit mehreren spei- 
cherbaren Programmen gut aus- 
genutzt werden kann. 

Das EPROM, IC1, wird mit den 
Adreßbits Al . . . A10 des (erwei- 
terten) Adreßbus der dCPU-4 
verbunden, und zwar an den 
Eingängen für A0. . . A9. Das Bit 
A0 selbst dient der Selektierung 
zwischen Low Nibble und High 
Nibble während eines Codezu- 
griffs, das wiederum durch IC6 
der Speicherplatine gesteuert 
wird. Durch diese Schaltung ist 
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Projekt 


n> 


Accumu- 

lator 



Bild 14. Die 
Schaltung für die 
Speicherplatine. 




ALU 
IC 2 


Control 
Unit #1 

. 

Pro gram 



Counter 


IC 8 

■ r 

IC 9 

r P 


Befehls- 
Puffer- 
Register 
IC 11 
IC 12 


Adreß- 

Puffer- 

Register 

IC 10 


Daten- 

Bus- 

Treiber 


Bild 12. Daten- 
und Steuer- 
signalfluß 
während der 
zweiten 
Load-Phase. 


r^> 


Accumu- 

lator 


<- 

n 


$ v v- 

3ov^ 


Control 
Unit #2 






■v u 




Control 



Program 




; 

Adreß- 

Umt#l 

■ - 

Counter 


Bus- 

IC 8 


IC 

: ;-y 

Treiber 


Befehls- 
Puffer- 
Register 
IC 11 
IC 12 


Adreß- 

PufFer- 

Register 

IC 10 


Daten- 

Bus- 

Treiber 


Bild 13: Daten- 
und Steuer- 
signalfluß 
während der 
Execute- 
Phase. 


die Verwendung eines 8-Bit- 
Assemblers, wie er im nächsten 
Teil vorgestellt werden wird, 
möglich, ohne den erzeugten 
Code in einzelne Halbbytes auf- 


teilen zu müssen (der Hinweis 
zur Berechnung der Sprung- 
adressen aus dem zweiten Teil 
dieser Artikelserie bleibt gleich- 
wohl erhalten). 


Diese Beschaltung des 
EPROMs ist praktikabel, da 
dieser Speicher nur ausgelesen 
wird. Im Fall des RAMs muß 
allerdings auch mit Schreibzu- 


griffen gerechnet werden, und 
dann müßte ein Schreibzugriff 
auf das obere Nibble eines Da- 
tenbytes durch einen Lesezu- 
griff auf das untere Nibble mit 
gleichzeitigem Rückschreiben 
begleitet werden: Ein zwar lös- 
bares Problem eines kleinen Zu- 
standsautomaten, aber ange- 
sichts einer sehr viel einfache- 
ren Lösungsmöglichkeit wurde 
hier darauf verzichtet: Das 

RAM, IC2, wird nur in den un- 
teren 4 Bits benutzt. 

Der Ein- und Ausgabeport be- 
steht jeweils aus einem 
GAL20RA10 mit entsprechen- 
der Programmierung. Eine Zwi- 
schenspeicherung am Eingabe- 
port geschieht nicht, die Daten 
können zwar in zwei Schritten 
eingelesen werden, müssen aber 
über beide Lesezyklen konstant 
bleiben. Der Ausgangs- 
20RA10, IC5, kann eine LED 
treiben, die zum Beispiel über 
einen 1-kQ- Widerstand an +5 V 
geschaltet ist und genau dann 
leuchtet, wenn der Ausgang auf 
Low geschaltet ist. 

Der nächste Teil bringt die noch 
fehlende Hardware (Taktpla- 
tine) und beschäftigt sich mit 
dem schon erwähnten 8-Bit- 
Assembler. roe 


62 


ELRAD 1994, Heft 12 





Rechner-Baustelle 

4-Bit-Mikroprozessor selbst entwickeln, Teil 4: Die Taktplatine 
und die Assembler-Programmierung 



Dietmar P. F. Möller, 
Christian Siemers 

Bisher zeigte der 
Artikel, wie man man 
das Konzept einer CPU 
selbst entwickelt und 
in konkrete Schaltungs- 
technik überführt. 

Eine Speicher- und 
I/O-Platine sorgt für 
die notwendige 
Kommunikationsfähig- 
keit mit der Außenwelt. 
Um dem Kleinrechner 
aber auch Leben 
einzuhauchen, fehlen 
ihm noch eine Takt- 
Platine als Motor und 
natürlich Software. Als 
Programmier- 
umgebung bieten 
sich hier tabellen- 
gesteuerte 8-Bit- 
Assembler an. 


ie Speicherplatine zur 
4-Bit-CPU (Bild 15) enthält 
neben einem EPROM zur Un- 
terbringung eines oder mehrerer 
Programme und einem stati- 
schen RAM einen 8 Bit breiten 
I/O-Port sowie eine Dekodier- 
und Umschaltlogik (Bild 14, 
ELRAD 12/94). Ein- und Aus- 
gabeport bestehen jeweils aus 
einem GAL20RA10 (IC4, IC5). 
Listing 7 und 8 zeigen die rele- 
vanten Teile der Programmie- 
rung dieser Bausteine. Die 
Wahl fiel auf GALs vom Typ 
20RA10, da diese eine große 
Flexibilität insbesondere bei der 
Taktdefinition besitzen. Dies 
kann beispielsweise in erweiter- 
ter Programmierung ausgenutzt 
werden. 

Je zwei der Output-Leitungen 
des IC5 sind fest miteinander 
verdrahtet. Die Programmie- 
rung bewirkt allerdings, daß 
maximal eine der Leitungen 
treiben kann. Die Ausgangstrei- 
ber sind im übrigen nur aktiv, 
wenn der Pin 13 des GAL 
(/RD_IN) auf Low liegt. 

Die Lage der Speicher- und 
I/O-Bereiche wird durch das 
GAL IC3 bestimmt, das auch 
zugleich eine Auswahl aus den 
möglichen Programmbereichen 
mit Hilfe von vier Schaltern 
(SW1) ermöglicht. Die Wahl 


fiel hier auf ein GAL26CV12, 
da dieses zwölf Output-Leitun- 
gen besitzt. Die Programmie- 
rung läßt sich vielen Gegeben- 
heiten anpassen. Die im Li- 
sting 9 vorgeschlagene Version 
bietet von 00h...0ffh 256 Halb- 
bytes (also 128 Bytes) Pro- 
grammspeicherplatz (EPROM), 
von 100h... lfdh 254 RAM- 
Speicherzellen und bei lfeh 
sowie lffh die Ein- oder Aus- 
gabeports, Low und High Nib- 
ble, zwischen denen je nach 
Lese- oder Schreibrichtung 
umgeschaltet wird. Das Adreß- 
bit A8 wird bei Datenspeicher- 
zugriffen automatisch auf ‘U 
generiert, wenn auf der dCPU- 
4 der Jumper JP1 gesteckt ist. 

Immer im richtigen 
Takt 

Bild 16 zeigt die Schaltung der 
Taktplatine. Ein Quarzgene- 
rator erzeugt zusammen mit 
einem Zählerbaustein vom 
Typ 74HCT93 (IC2) einen teil- 
baren Takt. Mittels DlP-Schal- 
ter SW1 lassen sich Taktraten 
von 1 MHz, 500 kHz (1:2), 
125 kHz (1:8) und 62,5 kHz 
(1:16) wählen beziehungsweise 
auf Handtakt umstellen. Mit 
Hilfe des manuellen Taktsi- 
gnals lassen sich die Phasen 
der CPU einzeln durchlaufen 


und so die Signalwege genau 
verfolgen. Die Generierung 
übernehmen zwei Gatter eines 
7400 (IC 1 ) in Zusammenarbeit 
mit einem Taster (S2). Das 
Reset-Signal wird mit den bei- 
den verbleibenden Gattern aus 
IC1 sowie S1 generiert. Ein 
9poliges Kabel stellt die Ver- 
bindung mit der dCPU-4 her. 
Es kann gleich auch die 
Stromversorgung der CPU 
übernehmen. An dieser Stel- 
le sei daraufhingewiesen, daß 
die Numerierung des Steckers 
ST2 im Schaltplan der CPU, 
Bild 6 in ELRAD 1 1/94, falsch 
ist. Pin 5 des Steckers - das 
Reset-Signal - muß in der 
Zeichnung oben liegen, Pin 1 
unten. 

Der Strombedarf der dCPU-4 
einschließlich der Takt- und 
Speicherplatine ist, bedingt 
durch die eingesetzten GALs 
und deren Verlustleistung, recht 
groß. Es sollte eine Spannungs- 
versorgung von 5 V/2 A zur 
Verfügung stehen, um einen 
einwandfreien Betrieb zu ge- 
währleisten. 

Das Einschaltverhalten der 
dCPU-4 entspricht dem aller 
CPUs. Das Reset-Signal muß so 
lange gehalten werden, bis der 
Takt einen stabilen Zustand er- 
reicht hat und kann dann 
zurückgenommen werden. 
Nach dem Einschalten der Ver- 
sorgungsspannung empfiehlt es 
sich also unbedingt, das Reset- 
Signal nochmals auszulösen. Im 
Handbetrieb muß der Reset- 
Knopf sogar gehalten werden, 
während per Hand ein Taktim- 
puls ausgelöst wird. Durch die- 
sen Kunstgriff setzt die CPU, 
unabhängig vom Einschaltver- 
halten bei Anlegen der Be- 
triebsspannung, garantiert alle 
Register auf einen gültigen 
Wert und startet korrekt. 

Die Assembler- 
programmierung 

Nach vielen Details zum inter- 
nen Aufbau fehlt eigentlich nur 
noch die Programmierung. An 
dieser Stelle sei nochmals dar- 
auf verwiesen, daß die konkre- 
ten Befehle, die der Assembler- 
programmierer nutzen kann, 
eine Folge des internen Aufbaus 
einschließlich der Programmie- 
rung der GALs sind (siehe hier- 
zu Tabelle 2 im ersten Teil des 
Artikels). 

Als Übersetzungsprogramm 
bieten sich tabellengesteuerte 
8-Bit-Assembler an. Teilweise 
sind diese sogar alsShareware- 
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Projekt 


Projekt 


Programme erhältlich. So bei- 
spielsweise der von Speech 
Technology Inc., Software Di- 
vision, 837 Front Street South, 
Issaquah, WA 98027. Fine für 


die dCPU-4 gültige Überset- 
zungstabelle gehört zum Lie- 
ferumfang der Platine und ist 
auch in der ELRAD-Mailbox 
zu finden (TASMD4.TAB). 


Die Assemblerprogramme für 
die dCPU-4 werden nach den 
allgemein üblichen Regeln ge- 
schrieben und übersetzt. Hierzu 
gehören Definitionen von Va- 


riablen beziehungsweise Spei- 
cherplätzen, Sprungmarken, 
Statthalter für aktuelle Werte 
zum Beispiel des Programm- 
zählers ebenso wie bedingte 



Bild 16. Auf der 
Taktplatine wird 
neben den verschie- 
denen Taktraten 
auch das Reset- 
Signal erzeugt. 



Stückliste 

Taktplatine 

Halbleiter 

IC1 

74LS00 

IC2 

74LS9 

Sonstiges 
RI... 4 

10k 

2 x CB 

lOOn, ker. 

Oszillator Quarzoszillator, 1 MHz 

SW1 

DIP-Switch 8 

Sl,2 Minitaster, 2pol., Um 

ST1 Sub-D-Buchse, weibl. 

1 Platine 



Bild 17. Der Motor der CPU: 
die Taktplatine. 


Stückliste 

Speicherplatine 

Halbleiter 


IC1 

EPROM 27C256 

IC2 

RAM 6264 

IC3 

GAL 26CV12 

IC4.5 

GAL 20RA10 

IC6 

74LS257 

Sonstiges 

RI, 2 

Widerstände 3k3 

RN1 Widerstandsnetzwerk 

4 x 10k 


5 x CB Kondensatoren, lOOn, ker 
SW1 4fach Dil-Schalter 

ST1 25pol. Sub-D-Buchse, 
gewinkelt 

2 x Steckerleiste, 1 x 8pol. 

1 Platine 


CHIP 

OUT_P0RT 

GAL20RA10 





/PL 

/WR OUT 

AO 

NC 

NC 

NC 

DO Dl D2 

D3 

NC 

GND 





/OE 

NC 

NC 

OO 

01 

02 

03 04 05 

06 

07 

VCC 





00 


• - 

DO 

* /AO + 00 

AO 

; Untere Bits: AO = 0 

OO.CLCK 

= 

/WR_0UT 





04 


: = 

DO 

* AO 04 * 

/AO 

; Obere Bits: AO = 1 

04.CLCK 

8 

/WR_0UT 







IC 2 

73 ( 

6264 

ro V 


Hl- 


o 

CD 



n 

CD 


IC 6 A 
74LS 257 H 


IC 3 26CV12 , 

DEKODIERUNG V 


• • ° 



v IC 5 20RA10 

CD 

IC 4 20RA10 > 

* IN _PORT 

mJLm 

■r 

OUT-PORT V 


o 

CD 


O 


C 


] ■ 


“U 

o 

73 


I. .3 


o 

35 


Listing 7. Ausgabeport auf der Speicherplatine (IC4, * Bild 15. Die Speicherplatine der dCPU-4 bietet zusätzlich acht 

20RA10). I/O-Ports. 
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CHIP 

IN_P0RT 


GAL20RA10 






/PL 

NC 

10 

11 

12 

13 

14 

15 

16 

17 

NC 

GND 







/OE 

D3 1 

D2 1 

Dl 1 

DO 1 

D3 0 

D2 0 

Dl 0 

DO 0 

NC 

AO 

VCC 








D0_0 = IO ; Die Ausgaenge treiben den Datenbus, und 
DO_O.TRST = / AO ; zwar doppelt, wobei die eigentliche 

D0_1 = 14 ; Auswahl durch AO, das Treiben der Daten- 

D0_1.TR$T = AO ; leitung durch /OE geschieht 


CHIP Dekodier-IC GAL26CV12 


Al 

A2 

A3 

A4 

A5 


A6 

VCC 

A7 

A8 

A9 

A10 

All 


/RD 

/WR 

AI14 

AI 13 

AI12 

AI 1 1 

/CS 

_EPR 

/CS RAM 

GND 

/WR_0üT 

/RD_IN 

P3 

P2 

PI 


PO 

NC 

AI 1 1 = 

PO ; nur 

einfaches 

Durchschalten; 

dies 

bewirkt, 

dass 



AI12 = PI ; jeder Codebereich 2 kByte gross sein kann, wobei 
AI13 = P2 ; allerdings die Schaltung am EPROM eine AI14 = P3 
; Beschraenkung auf prinzipiell 1 kByte ergibt. 

CS_EPR = A8 * /A9 * / Al 0 * /All * RD ; hierdurch ergeben sich 

; 256 Bytes Code 

RD_IN = Al * A2 * A3 * A4 * A5 * A6 * A7 * A8 * /A9 * /A10 

* /All * RD ; in den obersten 2 Bytes 

WR_OUT = Al * A2 * A3 * A4 * A5 * A6 * A7 * A8 * /A9 * /A10 

* /All * WR ? in den obersten 2 Bytes 

CS_RAM = A8 * / A9 * /A10 * /All * /RD_IN * /WR_OUT 
? in den unteren 254 Bytes befindet sich RAM 


Listing 8. Eingabeport auf der Speicherplatine (IC5, 20RA10). 


CHIP 

Dekodier-IC 

GAL26CV12 




Al 

A2 

A3 

A4 

A5 

A6 

A7 

AB 

A9 

A10 

All 

/RD 

AI 14 

AI 1 3 

AI 12 

AI 1 1 

/CS EPR 

/CS RAM 

/WR_0UT 

/RD_IN 

P3 

P2 

PI 

PO 


AI 1 1 
AI12 
AI 1 3 
AI14 
CS_EPR 


RD_IN = 
WROUT = 
CS_RAM = 


PO 
PI 
P2 
P3 
/ A8 


Al 
! A8 
Al 
r A8 
A6 


/A9 


VCC 

/WR 

GND 

NC 


; nur einfaches Durchschalten; dies bewirkt, dass 
; jeder Codebereich 2 kByte gross sein kann, wobei 
; allerdings die Schaltung ai EPROM eine 
; Beschraenkung auf prinzipiell 1 kByte ergibt. 

/A10 * /All * RD ; hierdurch ergeben sich 


A2 * A3 * A4 
/A9 * /A10 * 
A2 * A3 * A4 
/ A9 * /A10 * 
/ A9 * /A10 * 


* A5 
/All 

* A5 
/All 
/All 


256 Bytes Code 
7 

in den obersten 2 Bytes 


A6 
RD 
A6 

WR ; in den obersten 2 Bytes 
/RD_IN * /WR_OUT 


in den unteren 254 Bytes befindet sich RAM 


Assemblierung. Ausnahme der 
allgemeinen Regel: Das Fehlen 
einer Stack-Struktur läßt auch 
keine Unterprogrammsprünge 
zu. Dieses Fehlen kann jedoch 
durch einen Assemblertrick auf 
gute Weise ausgeglichen wer- 
den. 

Eine Möglichkeit dazu zeigt 
Listing 10, in dem ein Assem- 
blerprogrammabschnitt für die 
dCPU-4 dargestellt ist. Der 
Rücksprung aus der Routine - 
‘UNTER’ genannt - wird in 
einer vereinbarten Stelle ($80 
und $81) gespeichert, die für 
einen indirekten Sprungbefehl 
genutzt wird. Aus diesem 
Grund kann die Routine auch 
von mehreren Punkten erreicht 
werden, ohne daß ein festge- 
legter (direkter) Sprungbefehl 
dafür genutzt werden muß. Der 
Pferdefuß dieser Methode be- 
steht darin, daß 8-Bit-Assem- 
bler normalerweise die 2x4- 
Bit-Adresse des PC nicht sym- 
bolisch laden können. Daher 
muß die Adreßberechnung zu- 
mindest für die High-Nibble- 
Adresse per Fland geschehen. 
Dies wäre natürlich mit einem 
echten 4-Bit-Assembler ausge- 
schlossen. 


Damit ist der Phantasie der Pro- 
gramme, die neben dem geläufi- 
gen Assembler auch die Mikro- 
programme erfaßt, (fast) keine 
Grenze mehr gesetzt. Im Prinzip 
können die Probleme nun da- 
durch gelöst werden, daß nicht 
mehr die Software, sondern zu- 
erst die Mikroprogrammierung 
erstellt wird, auf der dann die 
‘klassische’ Software basiert. 
Das Projekt dCPU-4 ist natür- 
lich mehr ein Lehrstück, an dem 
prinzipiell alle Aktionen er- 
kannt werden können. 

Der nächste Schritt, die Synthese 
dieser Logik in einem CPLD 
oder FPGA, ist da schon wesent- 
lich aufregender, was die erwei- 
terten Möglichkeiten angeht. Die 
iCPU-4, die integrierte Version 
der dCPU-4, wird in einer der 
folgenden ELRAD-Ausgaben 
vorgestellt. Sie bietet einige we- 
sentliche Erweiterungen gegen- 
über der diskret aufgebauten 
Version. Allerdings ist ihre Ar- 
beitsweise von außen nicht mehr 
so leicht zu durchschauen. Wei- 
terhin ist eine Beschreibung des 
Rechnermodells in der VHSIC 
Hardware Discription Language 
(VHDL) geplant. pen 


Listing 9. Dekodierung des Speicherbereichs (IC3, 26CV12). 


; Dieses 

Programm 

simuliert einen Unterprogrammsprung! 

; Am Ausgabeport wird dabei eine 0 

staendig durchgeschoben, ansonsten 

? verlaeuft das Programm in einer Endlosschleife 

Idefine 

PORT LOW 

$FE 


Idefine 

PORT HIGH 

$FF 


Idefine 

ZW 1 


$10 

Idefine 

PC LOW 


$80 

START 3 





LDAA 

#$E 

eine LED soll leuchten! 


STAA 

ZW 1 



LDAA 

#$F 



STAA 

ZW 1+1 



SEC 


fuer ausgeschaltete LED 


LDAA 

1* 

Laden des Programmzaehlerstands 


ADDA 

#$c 

Offset von 12 fuer richtigen Ruecksprung! 


STAA 

PC LOW 

Aber: Dies war leider nur ein 4 -Bi t Wert! 


LDAA 

#$i 

und dies die obere Haelfte, leider ohne 


STAA 

PC_L0W+1 ; Assemblerunterstuetzung, muss also selbst 




berechnet werden 


JMP 

UNTER 

Unterprogramm wird aufgerufen 


JMP 

START 3 

Endlosschleife 

.UNTER: 





LDAA 

ZW_1 

Port setzen und naechsten Wert 


STAA 

PORT LOW ; vorbereiten 


ROLA 




STAA 

ZW 1 



LDAA 

ZW_1+1 

High Nibble 


STAA 

PORT HIGH 



ROLA 




STAA 

ZW 1+1 



JMP 

(PC LOW) ? Ruecksprung! 

.END 





Listing 10. Assemblerroutine mit emuliertem Unter- 
programmsprung. 
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